さまざまな言語を正確に認識し理解するために機械を訓練するための多様で正確な音声データセットを世界中で提供しています。
連絡先
詳細はこちら
原理
アルゴリズム研究
デマンドマイニング
設計の定義
試験改良
製品管理
品質管理
データパッケージング
データ配信
データ収集
グローバルリソースから
マルチ環境
室内
スタジオ
屋外
車載
マルチデバイス
スマホ
パソコン(デスクトップ/ハンドヘルド)
Pro (ハイファイ録音機/アレイマイク)
録音オブジェクト
言語:中国語、英語、フランス語、ドイツ語…
性別比: 1:1
年齢:子供、大人…
教育の背景:各段階
マシンマークアップ
人為的に転写された
人工&機械共同
3輪品質検査を完了する
寸法すんぽう
精度95%超
独自に研究したアルゴリズムを音声タグ付けに適用し、タグ付けの効率と精度を確保した。前段階のトップダウン設計を経て、中期的に厳格にコントロールして、後の3回の品質検査を経て、最終的なデータ製品は訓練後の機械モデルに音声認識、意味理解とヒューマンマシンのインタラクションの面で優れたパフォーマンスを発揮させた。
音声データセット
基礎分類
中国語共通語:10,000人
中国語会話:500人
年齢
中国語の子供:10,000人
中国語のお年寄り:800人
アクセント分類
客家方言:2,000 人
西南共通語:1,000 人
中原共通語:1,000 人
環境分類
車載:計画中
オフィス:計画中
言語分類
中英混読:9,000 人
アメリカ英語:1,500 人
オーストラリア英語:1,000 人
シンガポール英語会話:300 人
フランス語会話:500 人