盛大な独り言日記・自分用メモ2010.11.17~
×
[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。
atoiがとっても便利です。
int a =atoi(char型の何か)
→char型の何かの先頭にある文字型数字を自動でintに変換してaに格納してくれるそうです。
めかぶは品詞を半角数字のidで一緒に出力できるので、これで品詞ごとに分けた辞書ファイルがつくれました。
ただ区分が細かすぎるので扱いが難しいですね。名詞とかはともかく、
動詞は活用形のまま切れているので扱いにくそうです。助詞とかも。
知られている、を辞書に登録するとして、数字一つにつき一個ファイル作ってたら
31 知ら
32 れ
18 て
33 いる
7 。
という区切りででそれぞれの辞書に分けられてしまいます。
あんまりブチブチ区切るのもよくなさそうなので、ある程度まとまった辞書とかのほうがいいのかな。
書き換え規則とかを細かく指定できるならいいんですけどね。まだどこまでできるかわからないしな…
辞書分けとかについて考えたら、生成文法を使った文章生成を考えてみようかなと思います。
今のところちゃんと自然言語の喋れる無能の作成を目指しているのですが、卒研の目標はブレブレです。
無能か知能でヘルプ作るって言ってたけど、プログラム作っていくうちにどんどん違うんじゃないかこれってなってきた(^q^)
とりあえず勉強も兼ねての無能作成に専念しようかな…。やってれば何かいいアイデアが思いつくのではないかとそんな目の逸らし方をしています。
int a =atoi(char型の何か)
→char型の何かの先頭にある文字型数字を自動でintに変換してaに格納してくれるそうです。
めかぶは品詞を半角数字のidで一緒に出力できるので、これで品詞ごとに分けた辞書ファイルがつくれました。
ただ区分が細かすぎるので扱いが難しいですね。名詞とかはともかく、
動詞は活用形のまま切れているので扱いにくそうです。助詞とかも。
知られている、を辞書に登録するとして、数字一つにつき一個ファイル作ってたら
31 知ら
32 れ
18 て
33 いる
7 。
という区切りででそれぞれの辞書に分けられてしまいます。
あんまりブチブチ区切るのもよくなさそうなので、ある程度まとまった辞書とかのほうがいいのかな。
書き換え規則とかを細かく指定できるならいいんですけどね。まだどこまでできるかわからないしな…
辞書分けとかについて考えたら、生成文法を使った文章生成を考えてみようかなと思います。
今のところちゃんと自然言語の喋れる無能の作成を目指しているのですが、卒研の目標はブレブレです。
無能か知能でヘルプ作るって言ってたけど、プログラム作っていくうちにどんどん違うんじゃないかこれってなってきた(^q^)
とりあえず勉強も兼ねての無能作成に専念しようかな…。やってれば何かいいアイデアが思いつくのではないかとそんな目の逸らし方をしています。
PR
この記事にコメントする