対訳コーパスとは?

多くの機械学習システムと同様に、機械翻訳(MT)が良質な訳文を生み出すためには、大量のデータが必要です。

対訳コーパスとは、2言語間の大量の訳文テキストを構造化したものです。機械翻訳アルゴリズムによる高品質な翻訳を実現するには、通常、トランスレーターによって生成されたデータを用いたトレーニングが行われます。

機械翻訳エンジンの改善を目指す企業様向けに、Gengoは70を超える言語ペアから大量の翻訳データを提供いたします。弊社に登録している22000人以上のトランスレーターが、効果的な機械翻訳システムの構築・トレーニングに必要な大量の翻訳データを提供します。

Gengoを選ぶ理由

規模

50万以上のセグメントを有する膨大な翻訳データベースを、言語ペアごとに、最短のリードタイムでご提供いたします。

品質

全てのデータは人力翻訳によるものです(機械翻訳後編集ではありません)。また、訳文を適切な位置で分割し、お客様のシステムに入力しやすいよう調整いたします。

価格

お客様の必要とする量と言語に応じ、セグメント単位で明瞭かつ手頃なお値段をご提示いたします。

コンテンツカテゴリー

特定のコンテンツをお探しですか?Gengoでは23のコンテンツカテゴリーをご用意しております。

  • アート・エンターテイメント
  • 自動車
  • ビジネス・工業
  • 人材
  • 教育
  • 家庭・子育て
  • 金融
  • フード・ドリンク
  • 医療・健康・フィットネス
  • 趣味
  • ホーム・ガーデン
  • 法律・政府・政治
  • ニュース
  • ペット
  • 不動産
  • 宗教・スピリチュアル
  • 科学
  • 小売
  • 社会・文化
  • スポーツ
  • スタイル・ファッション
  • テクノロジー・コンピュータ
  • トラベル

その他サービス

機械翻訳の再トレーニング

お客様の機械翻訳のエラーを識別・訂正し、自然で正確な翻訳をご提供いたします。

お客様のご要望に合わせたコーパス

特定の言語ペアやコンテンツをお求めですか?お客様のシステムに合わせた専用のコーパスをご用意いたします。

Gengoの対訳コーパスにご興味をお持ちですか?

弊社アカウントマネージャーにご相談ください。