偏読日記@はてな

本を読んだりゲームをしたり、インターネットの話をしたりします。小説も書きます。

Web文体診断にプロレタリア文学認定されたでござるの巻

文体診断ロゴーン

Yahooが提供している日本語形態素解析Webサービスを利用し、任意の文章(最大5000字)を入力すると文体を診断してくれるサービス。入力された文章の文体が作家の誰と近いかを判定し、読みやすさ・堅さ・表現力・個性の4項目で評価してくれます。
これは面白そうだと思い、俺もさっそくチャレンジ。とりあえずは最近書いたものとして、やみなべ祀弐で出した同人誌の原稿を入れてみました。

出てきた結果は以下の通り。

  • 一致ベスト3:1位 小林多喜二  2位 松たか子  3位 阿刀田高
  • 一致ワースト3:1位 岡倉天心  2位 吉田茂  3位 岩波茂雄
  • 評価(A〜Eの5段階):文章の読みやすさC 文章の硬さA 文章の表現力A 文章の個性C


……小林多喜二? え、俺って実はプロレタリアのために戦っていたの?


1本だけでは判定誤差かもしれないとこれまでに書いた同人原稿を全部入れてみれば、ベスト3に小林多喜二と阿刀田高のどちらかがほぼ必ず入っていました。この二人に形態素解析的な意味で「似てる」のね…… 小林多喜二の文章を入れると「一致ベスト:1位 松たか子(2位が本人)なんて結果が出るサービスなので多少の順位にはあまり意味は無さそうですけれど。
得点詳細という形で出力される平均文長・平均句読点間隔・名詞/動詞出現率などの偏差値を眺めてみる方が実際的な「診断」として役に立ちそうです。
いつでも名詞出現率が妙に低く特殊語(記号)の出現率がやたら高いのが俺の特徴のようで。そして助詞出現率が毎回乱高下し、恐ろしく高いときと低いときのあいだを揺れ動いている結果が出たのは面白かったです。こういうのは自分では気づかないよなあ。