"LanguageExtended" (組込み分類器)

テキストが自然言語の何語のものかを識別する.

クラス

詳細

  • この分類器はテキスト入力が一意的な言語で書かれていると仮定する.確率は,言語の比率ではなく,テキストが書かれた言語についての信念を反映している.
  • 現行バージョンでは,すべての言語がいずれかの公式アルファベットで書かれていなければならない.

例題

すべて開くすべて閉じる

  (2)

例題リストが何語か判別する:

最も可能性が高い言語の確率を得る:

この分類器のためのClassifierFunctionを得る:

この分類器をテキストのリストに適用する:

スコープ  (2)

組込みの分類器に対応するClassifierFunctionをロードする:

使用可能なクラスを得る:

組込みの分類器に対応するClassifierFunctionをロードする:

この分類器をテキストサンプルのリストに適用する:

サンプルのテキストを音訳し,音訳したテキストに分類器を適用する:

オプション  (3)

ClassPriors  (1)

カスタムのClassPriorsを使って可能な出力を制限する:

IndeterminateThreshold  (1)

カスタムのIndeterminateThresholdを使う:

UtilityFunction  (1)

分類器の効用関数を入手する:

この効用関数に変更を加えて,間違ってに分類されたにペナルティを科す:

新たな効用関数を使ってテキストを分類する:

結果をデフォルトの効用関数のものと比較する:

考えられる問題  (1)

場合によっては,言語ではないテキストが言語として認識されることがある:

おもしろい例題  (1)

さまざまな可能な言語をその確率とともに入手する:

WordCloudを使って結果を可視化する: