[REQ] Script tokenisasi, stemming (Nazief), dan stopword dalam PHP
Kalo tokenisasi sepertinya tidak terlalu ribet ya gan. Untuk stemming, coba lihat open source library Sastrawi. Kebetulan ada data stopwordsnya juga dan Bahasa Indonesia. Kalo untuk open mining, NLTK, dsb itu banyak source code nya pakai python sih.