名前: 本田 日時: 2002-03-14 10:03:50 IPアドレス: 61.115.38.*
>>7331 本田@脱線です >ある雑誌によると、このような「単語の検索作業」は簡単なことであり、 kakashi,chasenのようなツールで,「分かち書き」にします そういえば,Ωから形態素解析のツールを呼んでという話がどこかで。。 #BIT別冊だったかな。。。 >しかしながら、各ページの「ランキング付け」は容易ではないようです。 >これは、それぞれの企業秘密であり、とても複雑で難しいようです。 googleのベースになるアルゴリズムは公開されています。 googleを作った人達が論文を出しているはずで, kakashiの作者の馬場さんのWebに解説があるように記憶しています 数学的には「線形代数++」の知識くらいで,そのアイデアに驚きました。 #実装が相当つらいのは間違いなさそう。。。
この書き込みへの返事: