因為VCA有用到fasttext的方法,所以就去fasttext.cc下載來玩看看,先嚐試照Tutorial練習。
第一個練習是Text classification,訓練出可以分類句子屬於哪一個Label的分類器。
資料集是15404筆有Label的句子,範例資料如下:
__label__sauce __label__cheese How much does potato starch affect a cheese sauce recipe?
Label標記的方式是,__label__標記,上例有兩個Label。
訓練指令如下,訓練資料cooking.train,指定model主檔名model_cooking:
./fasttext supervised -input cooking.train -output model_cooking
使用model時用下列指令,model_cooking.bin是分類器,"-" 代表由鍵盤輸入測試句:
./fasttext predict model_cooking.bin -
測試時,我輸入:
Which baking dish is best to bake a banana bread ?
它會回傳"__label__baking"
以測試資料集測試model,輸入下列的指令:
./fasttext test model_cooking.bin cooking.valid
回傳結果:
N 3000 <--- p="">P@1 0.539 <--- p="" precision="">R@1 0.233 <--- p="" recall="">Number of examples: 3000 <--- p="">
--->--->--->--->
沒有留言:
張貼留言