TextContents[text]

text 中に見付かった,実体,日付,数量,その他の,内容に関連した要素についての情報のデータ集合を与える.

TextContents[text,form]

タイプ form の例を検索する.

TextContents[text,{form1,form2,}]

タイプ form1, form2, の例を検索する.

TextContents[text,forms,props]

生成されたデータ集合内の各オブジェクトの特性 props を含む.

詳細とオプション

  • TextContents[text,]text は,文字列,File[]で表されるテキストファイル,ContentObject式,あるいはこれらのテキストオブジェクトのリストでよい.
  • TextContents[{text1,text2,},]は,各 textiの例を与える.
  • 識別タイプ form には以下がある.
  • "type"任意のテキストのコンテンツタイプ(例:"Noun""City"
    Entity[,]テキストのコンテンツタイプの特定の実体
    form1|form2|
  • 任意の formiにマッチするフォーム
  • Containing[outer,inner]タイプ inner を含むタイプ outer のフォーム
    Verbatim["string"]厳密にマッチされる特定の文字列
    patternマッチされる文字列パターン
    Automatic実体,日付,数量,およびその他のコンテンツに関連した要素
  • 次は,特性 props の可能な選択肢である.
  • "String"識別されたテキスト文字列(デフォルト)
    "Position"text 中の文字列の始点と終点の位置
    "Probability"識別が正しいという推定の確率
    "Type"コンテンツタイプ(実体タイプ等)
    "Interpretation"識別された文字列の標準的な解釈
    "Snippet"識別された文字列前後のテキストの断片
    "HighlightedSnippet"識別された文字列がハイライトされた,テキストの断片
    All上記の全特性
    {prop1,prop2,}特性指定のリスト
  • 次は,使用可能なオプションである.
  • AcceptanceThreshold Automatic識別を許容する最低確率
    TargetDevice"CPU"実体検出にCPUまたはGPUの計算を使うべきかどうか
    VerifyInterpretation False解釈可能性をチェックするべきかどうか

例題

すべて開くすべて閉じる

  (1)

テキスト中の実体を求める:

場所についての結果だけを得る:

場所と数量についての結果だけを得る:

すべての例についての解釈を得る:

実体についての指定された特性の集合を得る:

オプション  (2)

AcceptanceThreshold  (1)

デフォルトで,検出された実体の推定確率は,すべて0.5より上である:

AcceptanceThresholdを高くして,ほぼ確実に正しい実体だけを得る:

VerifyInterpretation  (1)

デフォルトで,実体の中には,正しくないあるいはまだ知識ベースに収録されていないという理由で解釈できないものがある:

VerifyInterpretationを使って解釈できない実体を除外する:

特性と関係  (1)

TextContentsTextPositionTextCasesと同じタイプを扱い,指定されたタイプについて,常にこれらの関数と同じ部分文字列を識別する:

TextCasesを使ってTextContentsの出力に似たデータ集合を得ることができる:

おもしろい例題  (1)

月についての英語版のウィキペディアのページのテキストをロードする:

このページから顕著なテキストコンテンツを抽出する:

このページで見付かったコンテンツタイプの頻度を可視化する:

このページで識別された著名人かもしれない人物を求める:

これらの人物を実体として解釈する:

これらの人物の職業を可視化する:

Wolfram Research (2019), TextContents, Wolfram言語関数, https://reference.wolfram.com/language/ref/TextContents.html.

テキスト

Wolfram Research (2019), TextContents, Wolfram言語関数, https://reference.wolfram.com/language/ref/TextContents.html.

CMS

Wolfram Language. 2019. "TextContents." Wolfram Language & System Documentation Center. Wolfram Research. https://reference.wolfram.com/language/ref/TextContents.html.

APA

Wolfram Language. (2019). TextContents. Wolfram Language & System Documentation Center. Retrieved from https://reference.wolfram.com/language/ref/TextContents.html

BibTeX

@misc{reference.wolfram_2024_textcontents, author="Wolfram Research", title="{TextContents}", year="2019", howpublished="\url{https://reference.wolfram.com/language/ref/TextContents.html}", note=[Accessed: 22-November-2024 ]}

BibLaTeX

@online{reference.wolfram_2024_textcontents, organization={Wolfram Research}, title={TextContents}, year={2019}, url={https://reference.wolfram.com/language/ref/TextContents.html}, note=[Accessed: 22-November-2024 ]}