2019年12月20日 星期五

fastText - text classification

因為VCA有用到fasttext的方法,所以就去fasttext.cc下載來玩看看,先嚐試照Tutorial練習。

第一個練習是Text classification,訓練出可以分類句子屬於哪一個Label的分類器。

資料集是15404筆有Label的句子,範例資料如下:

__label__sauce __label__cheese How much does potato starch affect a cheese sauce recipe?

Label標記的方式是,__label__標記,上例有兩個Label。

訓練指令如下,訓練資料cooking.train,指定model主檔名model_cooking:

./fasttext supervised -input cooking.train -output model_cooking

使用model時用下列指令,model_cooking.bin是分類器,"-" 代表由鍵盤輸入測試句:

./fasttext predict model_cooking.bin -

測試時,我輸入:

Which baking dish is best to bake a banana bread ?

它會回傳"__label__baking"

以測試資料集測試model,輸入下列的指令:
./fasttext test model_cooking.bin cooking.valid

回傳結果:

N 3000                                    <--- p="">P@1 0.539                              <--- p="" precision="">R@1 0.233                              <--- p="" recall="">Number of examples: 3000    <--- p="">



沒有留言:

張貼留言

IKEA吊櫃廚櫃

 好不容易裝好IKEA買來的吊櫃,花了三天。 從組裝,鑽牆,上牆調水平,累死我了。