Google翻訳」の翻訳精度が、ニューラルネットワーク搭載により劇的に向上したと話題になっている。

外観や操作は以前と全く変化していない。

gts

そこで、固有名詞や、一般とは違った訳が求められる場合の多い技術的用語を翻訳させてその実力を検証してみた。

まずは音楽方面から。サンプルには、下記のようなソフトウェアシンセサイザーのスペック表を使用。

2 Oscillators, FM modulation, ring modulation, sync, modulation envelope.
4 types of filters, distortion.
2 LFOs (synchronized with host).
Arpeggiator (synchronized with host).
Tempo delay (synchronized with host), stereo chorus/flanger.
Legato mode, portamento.
16 notes polyphony.
128 presets.
Thoroughly optimized for light CPU load using SSE instructions, etc.
Automation.

※KVR Audioの「Synth1」説明文より引用

新しいGoogle翻訳の結果がこちら

2オシレーター、FM変調、リング変調、同期、変調エンベロープ。
4種類のフィルター、歪み。
2つのLFO(ホストと同期)。
アルペジエーター(ホストと同期)。
テンポ・ディレイ(ホストと同期)、ステレオ・コーラス/フランジャー。
レガートモード、ポルタメント。
16音はポリフォニー。
128プリセット。
SSE命令などを使用して軽いCPU負荷に完全に最適化されています。
オートメーション。

完璧ではないものの、概ね自然に読んで理解できる内容となっている。

それでは、同じ文章をExcite翻訳にも通してみよう。引き合いに出して申し訳無いが、Google翻訳も以前は同程度の精度だった。

2  発振器、FM変調、リング変調、同期、変調封筒。
4タイプのフィルタ、歪み。
2 LFOs(ホストと同期する)。
Arpeggiator(ホストと同期する)。
速度遅延(ホストと同期する)、ステレオの合唱団/つば出し機。
レガートのモード、ポルタメント。
16は対位法に注目する。
128のプリセット。
完全に、軽いCPUロードのために、SSE手順などを使って最適化される
オートメーション。

こうして見ると、Google翻訳は「オシレーター」や「コーラス」など、シンセ関連では訳さずに使用するのが一般的な用語を判断しているのがわかる。

それでは、映像系も試してみよう。原文は「NTSC」についての、英語版Wikipediaの説明文

NTSC, named after the National Television System Committee,[1] is the analog television system that was used in most of the Americas (except Brazil, Argentina, Paraguay, Uruguay, and French Guiana); Burma; South Korea; Taiwan; Japan; the Philippines;[2] and some Pacific island nations and territories (see map).

The first NTSC standard was developed in 1941 and had no provision for color. In 1953 a second NTSC standard was adopted, which allowed for color television broadcasting which was compatible with the existing stock of black-and-white receivers. NTSC was the first widely adopted broadcast color system and remained dominant until 1997, when it is gradually being replaced with different digital standards such as ATSC, ISDB and others.

※英語版Wikipedia「NTSC」より引用

Google翻訳版はこちら。

NTSCは、全米テレビシステム委員会の名前を冠したもので、アメリカ大陸の大部分(ブラジル、アルゼンチン、パラグアイ、ウルグアイ、フランスガイアナを除く)で使用されていたアナログテレビシステムです。 ビルマ; 韓国。 台湾; 日本; フィリピン、[2]および一部の太平洋島嶼国および地域(地図参照)。

最初のNTSC規格は1941年に開発されたもので、色の規定はありませんでした。 1953年に第2のNTSC規格が採択された。これは、既存のモノクロレシーバのストックと互換性のあるカラーテレビジョン放送を可能にした。 NTSCは、広く普及した最初の放送カラーシステムであり、ATSC、ISDBなどの異なるデジタル規格に徐々に置き換えられている1997年まで支配的でした。

これも完璧ではないものの、全く意味不明になってしまう箇所はなく、かなり実用的だ。

それでは、本当に申し訳ないが(^^;)Excite翻訳の結果がこちら。

全米テレビジョン基準委員会、[1]がアメリカ大陸のほとんどにおいて使われたアナログテレビシステムであった後に名付けられたNTSC(ブラジル、アルゼンチン、パラグアイ、ウルグアイ、および仏領ギアナを除いて);ビルマ;韓国;台湾;日本;フィリピン;[2]およびいくつかの太平洋の島国家と領域(マップを見なさい)。

最初のNTSC方式は1941年に開発されて、色への用意を全然持っていなかった。1つの2番目のNTSC方式あたり1953年に採用された。それは、白黒のレシーバーの既存の株と互換であったカラーテレビ放送を考慮した。NTSCは、最初の広く採用された放送色システムであり、それが、ATSC、ISDB、他などの違うデジタルの標準と徐々に取り替えられる時には、1997年まで支配的であり続けた。

この精度でもかなり便利に使わせて頂いてきたが、やはり「世代が変わった」という感は否めない。

昨今、様々な分野でニューラルネットワーク系の技術が話題となっているが、また一つ、非常にわかりやすい形で便利さをもたらしてくれた。もちろん、一回ごとの利用がそのまま「学習」になっているはずなので、今後ますます精度が向上するだろう。

「AIは人間の仕事を奪う」とも喧伝されるが、是非肯定的な側面を最大限に活用して、より文化的な豊かさを広げる方向に活用したいものだ。