--- 素朴な疑問集 ---
トップページへ    [素朴な疑問集 TOP]


疑問No.481(2005.11.04)

Q. 恵夢78さんからの疑問

 多くのHPで、「社員」が「杜員」と表示されていますが、特別な意味、あるいは理由があるのでしょうか?
 実は、私の部下が作った会報の原稿(講演会の案内)をチェックしていたとき、「社員」が「杜員」となっているのを発見し、漢字の変換違いとは思えず、本人に聞いたところ、原稿の一部を、講演をお願いした講師のHPからコピーして作ったとのことでした。
 googleで「杜員」を検索したところ、896,000件余りもヒットしてしまいました。驚きとともにこういう表現もあるのか、それとも何らかの理由で化けてしまったのかと興味を持った次第です。

「杜員」なんて言葉、私も質問を頂くまで知りませんでした。実際に検索してみると、わんさか出てきました。この量はハンパじゃありません。(星田)


A. 007は二度寝るさんから

 たとえば、「束京(たばきょう)」をグーグルで検索してみてください。そんな言葉はないのに百万件余りヒットします。
 「束京」は「東京」に形が非常によく似ています。つまり、手書きまたは印刷物などの原本を、OCRによってテキスト化する際に間違った読み取り処理をして、それを後で修正しなかったからと推測できます。

A. Moriさんから

 パソコンのキーボードから「しゃいん」と入力して漢字変換したのではなく、すでにある紙の原稿をスキャナで読み取り、画像データからOCRソフトを使ってテキストに変換したのでしょう。
 おそらくその際にOCRソフトが「社」と「杜」を間違え、その後の目視チェックからも漏れたのではないでしょうか。「ブ」と「プ」の間違いなどはよく見かけます。

A. とんとんさんから

 私も初めて聞くことで、目を疑いました。Google検索もすごい数です。日本語のページに限っても279,000件でした。中国語などで使われるのかと思ったのですが、日本語のサイトでもめちゃめちゃ多くありました。
 考えられることとしては、会社のパンフレットか何かをOCRで読み取るとき、読み取り間違いを見逃してしまっていること。構成がいい加減である、ということでしょう。
 日本語変換の間違いで出てくるわけがないと思います。

A. まいけるさんから

 今回の疑問、「社」と「杜」の混用についての指摘を読み、早速Googleで「杜員」を検索してみました。すると、出てくる出てくる。確かに、驚くほどの検索結果がでてきました。
 でも、その中にちゃんと、「杜員」の理由が書かれたサイトがありました。どうも、OCRソフトによる誤変換の「校正漏れ」のようです。「杜員」の他にも、「社撰な」「10年問」などがあるそうです。
 今回の疑問「杜員」については、「講演をお願いした講師のHPからコピーし」たとありますから、この講師は、原稿を手書きし、それをOCRソフトで変換した際、ろくろく校正しなかった杜撰な先生である、という結論になります。
 「杜員」や「杜会」の検索結果が多い理由は、OCR変換を利用するのが企業や役所に多く、そこでは上記の言葉が使われている頻度が多いからでしょう。学校の先生も「杜会科」と誤っている例が多くみられます。

A. みももさんから

 896000件全てがそうというわけではありませんが、大半はOCR(スキャナで原稿を読み込んで文書ファイルにするもの)によるものです。
 言って見れば手書き入力のようなもので、似た字に誤認識されることがあります。専門の業者に委託してサイトを作ってもらう場合、原稿をファイルで渡す以外に未だに紙で渡されることもあり、そういう場合に使用されます。
 もちろん、読み取りミスも多いので、変換後にチェックはされますが、「見落としやすい間違い」というのがあるものです。「干葉県」「山ロ県(「ロ」はカタカナの「ロ」)」で検索してみてください。
 あとは、その間違ったものをそのまま引用してしまったというケースですね。個人のサイトの場合はこちらが多いでしょう。

江戸川三連豚さん、麻生有美さんからも、回答をいただきました。ありがとうございました。