スラドの記事より
ランダム生成された情報学論文が国際会議に受理されるという話題を覚えている方も多いと思われるが、NewScientistの記事によるとインディアナ大情報学部の研究者が、それを判別するプログラムInauthentic Paper Detectorを開発したそうだ(2006 SIAM Conference on Data MiningへのProceedings[pdf])。テキストを入力すると、ランダム生成されたかどうかの割合(パーセント)を計算し、Inauthentic/Authenticを判別する。
てなわけで色々やってみた。
一個前のエントリーをエキサイト自動翻訳して突っ込んだ→人間が書いた可能性32.2%
英→日同様、やっぱりネイティブの人からすると違和感ある英語なんだろうなぁ、自動翻訳って。
GNU GPL本文→人間が書いた可能性95.4%。
これは当たり前か。
今院の英語の授業で扱ってる、MITのとあるページ→人間が書いた可能性32.6%
どーりで訳しづらいはずだよ(´Д`)