google翻訳の技術倫理に悩む。

 今日の日記はgoogle翻訳で日本と中国に関する要らぬ議論が出ているという話です。多少政治的な話題が入りますが、政治的な話題はメイントピックではないです。

 google翻訳で、「中国が日本を侵略した」を英語に訳しても、「日本が中国を侵略した」を英語に訳しても、どちらも "Japan invaded China"となってしまうので、これはgoogleの陰謀に違いないという話が出ています。googleが中国の味方をしているという見方です。

 統計的機械翻訳という概念を知っていれば、この誤訳は「まあそういうこともあるだろうな」で済んでしまう話ではありますが、中身をまるで知らない人にとってみれば、なるほどgoogleが意図的に日本をおとしめているように見えても仕方がないところですね。

 googleというのは、いかに意図を持たずに情報を処理するかということに全力を注いでいる会社なので、まあ意図を持つということはまずないです。意図を持たないせいでミスることは多々あります。今回も意図を持たないことによるミスです。

 細かい技術の話はしませんが、ここまでが昨日知った出来事です。

 ここで技術者・研究者の端くれとして考えてしまうのが、技術倫理の問題です。

 技術者サイドとしては、開発途中のものであってもある程度使えそうなら公開したり売り物にしたりしてしまいたいわけです。で、売り物にしても通常はそれほど深刻な問題は出なかったりします。でもときとしてこういった大きな問題に発展してしまったかもしれない不具合が出てきます。そういったときにどう対処するのか。

 正直なところとしては「そういう技術なんだから許してください、直しません」といいたいところです。例外処理というのは、技術者が嫌うことの一つです。

 それから、開発途中のものを売り物にしていいのかという問題もあります。そもそも世の中に事故発生率が0のものはないので、程度問題ですね。

 今回の件を知って、情報処理技術による事故の影響力を見誤っていたかなということは感じました。google翻訳のような情報処理技術で国際問題が起きることはほぼ0だと思ってましたが、甘かったかもしれません。

 なぜ甘く見積もっていたかというと、まだ翻訳技術(特にgoogle翻訳)には誤訳が多いということは広く知られた話だと思っていたので、翻訳技術を信頼しきってしまう人などいないと思っていたからです。もはや、信頼される技術になってきているようです。

 とはいえ、開発を続けるためには開発途中のものも売り物にせねばならないので、さて、どうするのがいいんでしょうね。