自然言語処理の研究や機械学習に最適なコーパス。テキスト、音声、レキシコンなど用途に合わせたデータをご利用いただけます。
米国ペンシルバニア大学に本部をおく、LDC(Linguistic Data Consortium)の扱っているコーパスです。 テキストデータベース、音声データベース、レキシコン(辞典)など、豊富な語録とさまざまな形態のデータが揃っています。 自然言語処理研究や、機械学習、自動音声の開発など様々な用途にご利用いただけます。
この製品へのお問い合わせ
基本情報
【取扱実績の一例】 GALE Phase 4 Chinese Broadcast Conversation Transcripts LDC Catalog No.: LDC2013S04 DCMI Type(s): Text Data Source(s): broadcast conversation Language(s): Mandarin Chinese, Chinese 2000 NIST Speaker Recognition Evaluation LDC Catalog No.: LDC2001S97 DCMI Type(s): Sound Data Source(s): telephone speech Language(s): English Morphologically Annotated Korean Text LDC Catalog No.: LDC2004T03 Data Type: text Data Source(s): newswire Language(s): Korean
価格情報
LDC Corpusのご購入には、エンドユーザーさまからメーカーに直接コンタクトをとっていただく必要がございます。 ※弊社ではメーカーとお客さまの間でのお支払いの代行を致します。
納期
用途/実績例
自然言語処理、構文解析、アノテーション、機械学習、自動音声
企業情報
テガラ株式会社は、全国の研究開発者様に向けた専門的な製品の調達販売や 情報提供、サポートなどのサービスを統合した研究開発プラットフォームを 形成しています。 スピードが価値を持つ研究開発の分野で、お客様の研究開発の スピードアップのためのお手伝いをし、ひいては日本および世界の 研究・開発の推進をお手伝いすることがテガラの考える使命です。 研究開発者様にとっての心強いパートナーであり続けるために、当社は日々 新しい技術を磨き続け、サポート体制の強化を行っております。