Bilingual KWICは名古屋大学外山研究グループによって開発されたword alignment と呼ばれる技術を可視化するツールです。
文対応の取れた対訳コーパスを利用して、入力されたキーワードの対訳語を自動的に抽出します。
そして、入力されたキーワードと抽出された対訳語を基にKWIC(KeyWord In Context)形式で表示します。
複数の対訳語がある場合は一番出現回数が多い対訳語を含む文を表示した後、その下にその他の対訳語を含む文が順次表示されます。
Bilingual KWICは元々RubyをインストールされたLinuxとcygwin上でのみ動作が可能であったため、その使用にはある程度の知識が必要でした。
そこで、どこからも、誰からも利用できるようにとの名古屋大学からの依頼によりAJAXの技術を応用し、Bilingual KWICをサーバ上で使用できるように改良し、各自のブラウザーで利用できるようにしたのがWeb版Bilingual KWIC(文脈検索システム)です。
hitしたキーワードがセンターぞろえになるため文脈から翻訳の違いを見ることができます。
又単語だけではなく文の一部分であっても検索が可能なため今まで気付かなかった様なことも発見できることがあります。
実際に翻訳会社、政府の法令データベース検索、法令英訳辞書作成、大学の授業等様々な場所で利用されています。
お問い合わせ
上記リンクはWeb版Bilingual KWIC(文脈検索システム)が実装されている日本法令外国語訳データベースシステムへのリンクです。
例えば法令英訳の中で「無効」という単語にどの様な訳語が当てられているのかを調べたいとき、検索ボックスに「無効」と入力し検索すると「無効」についての対訳だと考えられるものが自動的に抽出され上から表示されます。
これにより同じ単語でも使い方によって訳語がどの様に変わっているのかが一目で分かります。
検索結果の表示例です。