盛大な独り言日記・自分用メモ2010.11.17~
×
[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。
形態素解析とは!
コンピュータ等の計算機を用いた自然言語処理の基礎技術のひとつ。(wikiより
ひらがなカタカナ漢字にも対応できる
対象言語の文法のルールや、単語リストを情報源として、自然言語で書かれた文章を
形態素(=言語で意味を持つ最小単位)に分割し、それぞれの品詞を判断する作業のこと。
英語だと単語と単語の間にスペースが入るので、比較的簡単に言葉の区切りを見つけることが出来るが、
日本語だとそうもいかないので難しいらしい。(「にわにはにわにわとりがいる」とか)
MeCabを試しに入れてみたのですが、文章入力→分割はコマンドプロンプト上で出来るのですが
コマンドを打とうとするとなぜかそれも解析されてしまうっていう…根本的に使い方を間違えている気が。。
外部ファイルに出力とかコマンドを使えば出来るみたいなので、そういうのうまくいけばいいな
コンピュータ等の計算機を用いた自然言語処理の基礎技術のひとつ。(wikiより
ひらがなカタカナ漢字にも対応できる
対象言語の文法のルールや、単語リストを情報源として、自然言語で書かれた文章を
形態素(=言語で意味を持つ最小単位)に分割し、それぞれの品詞を判断する作業のこと。
英語だと単語と単語の間にスペースが入るので、比較的簡単に言葉の区切りを見つけることが出来るが、
日本語だとそうもいかないので難しいらしい。(「にわにはにわにわとりがいる」とか)
MeCabを試しに入れてみたのですが、文章入力→分割はコマンドプロンプト上で出来るのですが
コマンドを打とうとするとなぜかそれも解析されてしまうっていう…根本的に使い方を間違えている気が。。
外部ファイルに出力とかコマンドを使えば出来るみたいなので、そういうのうまくいけばいいな
PR
この記事にコメントする