偏読日記@はてな

本を読んだりゲームをしたり、インターネットの話をしたりします。小説も書きます。

11万人ぶん「女の子の名前」をチェックしたらすべてを許せる気分になった

かつてWeb上に、ただひたすら「女の子の名前」を収集するプロジェクトがありました。
その名も「女の子の名前辞書計画」と題されたそのプロジェクトでは、それが現実に存在するか名前がどうかすら問わず、延べ11万人以上の「女の子の名前」が収集されていました。


2年近く更新が止まっているギャルゲーヒロイン自動生成の次なるバージョンアップに向け、俺が活用しようと思ったのはこの「女の子の名前辞書計画」の辞書データ。
辞書ファイルが公開されていたサイトは現在閉鎖していますが、PCの中を探し回ってみれば2005年11月13日版の辞書ファイルが保存してあったのでそれを使うことにしました。
自動生成される名前が「姓の数×11万」となり、現状の約1000通りに比べて飛躍的に増やせるのでは、と思ったのです。


だけど、改めて辞書ファイルを開いて中を確認してみればそう簡単にはいかず。
フィクションに登場する名前も収集の対象にしていたこと、収集がボランティアからの名前の提供に頼っていたことから、とても使えないようなものが大量に混じっていたのです。
「女の子の名前」が羅列されているはずのファイル内で「イスラエル」なんて単語を発見したときには目を疑いました。誰が提供したのこれ……? 「女の子」という以前に人名ですら無い。


結局、人名として妥当かどうかの判断は俺が一つ一つ見て下すしか無く、おかげで11万人ぶんの「女の子の名前」が並ぶファイルを眺めてチェックするハメになってしまいました。流し見ながらあからさまにおかしいもの(前述の「イスラエル」や「ぼう」等々)を削っていくだけで数時間。
しかも最後の方は麻痺してきてどんな「名前」を見ても人名に使えそうに思える(または人名ではありえないと思える)用になっている自分が恐ろしかったです。


と、そんな努力をしていたのが先月の半ば。
なぜ今ごろになってその話をしたかと言えば、録画したまま放って置いていたアニメ「化物語」をやっとのことで観たのがきっかけでした。
「戦場ヶ原ひたぎ」
化物語」に登場する彼女、部分だけ取り出すと名前に使う単語とは思えないのに総体としては何となく「女の子」のように感じられるこの名前に触れて少し前に自分がやっていたことを思い返してしまいまして。。


「ひたぎ」も当然のごとく例の辞書ファイルに含まれていましたが、「化物語」を観る前の俺は人名としてありえないとして削除していました。
恐らくは、名前として認識させるような何らかの音や単語の組み合わせがあるのでしょう。そう考えると出来るだけ元の「女の子の名前辞書計画」辞書ファイルの内容を尊重し、俺の判断で削除するものは本当に最低限にとどめておくべきなのかもしれません。
名前単体ではあり得なさそうに思えても、姓と組み合わさって初めて成り立つものもあるでしょうし。
早く仕分けを済ませてギャルゲーヒロイン自動生成に組み込む作業に移るためにも、元の辞書ファイルから使えないものを削除する作業は最小限で済ませておきたいです。


……でも、「イスラエル」だけは勘弁な。さすがにこのレベルでおかしい奴は省きたい。