TextPosition[text,form]

text 中で form の例が出現する始点と終点のリストを与える.

TextPosition[text,{form1,form2,}]

すべてのタイプ formiについての結果の連想を与える.

TextPosition[text,formspec,n]

求まった最初の n 個の例の位置を与える.

詳細とオプション

  • TextPosition[text,form]text は,文字列,テキストファイル,ContentObject式,あるいはそれらのテキストオブジェクトのリストでよい.
  • TextPosition[{text1,text2,},]は,各 textiの例を与える.
  • 識別タイプ form には以下がある.
  • "type"任意のテキストのコンテンツタイプ(例:"Noun""City"
    Entity[,]テキストのコンテンツタイプの特定の実体
    form1|form2|
  • 任意の formiにマッチするフォーム
  • Containing[outer,inner]タイプ inner を含むタイプ outer のフォーム
    Verbatim["string"]厳密にマッチされる文字列
    patternマッチされる文字列パターン
  • 次は,特性 prop の可能な選択肢である.
  • "String"識別されたテキスト文字列(デフォルト)
    "Position"text 中の文字列の始点と終点の位置
    "Probability"識別が正しいという推定の確率
    "Interpretation"識別された文字列の標準的な解釈
    "Snippet"識別された文字列周辺の断片
    "HighlightedSnippet"識別された文字列がハイライトされた,テキストの断片
    fすべての特性を含む連想に f を適用する
    {prop1,prop2,}特性指定のリスト
  • 次は,使用可能なオプションである.
  • AcceptanceThreshold Automatic識別を許容する最小確率
    PerformanceGoal Automatic特定の利点があるアルゴリズムを優先する
    TargetDevice"CPU"実体検出にCPUまたはGPUの計算を使うべきかどうか
    VerifyInterpretation False解釈可能性をチェックするかどうか

例題

すべて開くすべて閉じる

  (6)

文字列中の名詞を求める:

通貨量を求める:

テキスト中の,都市,国,日付の位置を求める:

すべての場所とその位置を求める:

テキスト中の「New York City」についてのすべての言及箇所を求める:

スコープ  (4)

ContentObjectおよびファイル  (2)

ContentObject中の色の例を求める:

File中の数量を求める:

代替案と包含  (2)

Alternativesを使って複数のタイプをマッチする:

文字列中の,通貨量を含むすべての文を求める:

文字列中の,国名を含むすべての文を求める:

AlternativesContainingを組み合せて高度に構造化されたクエリを作る:

オプション  (3)

AcceptanceThreshold  (1)

デフォルトで,検出された実体はすべて0.5より高い推定確率を持つ:

AcceptanceThresholdを高く設定して,正確である可能性が高い実体だけを得る:

PerformanceGoal  (1)

PerformanceGoal->"Speed"を使うことで速く検出できるようになるが,確度は下がる:

VerifyInterpretation  (1)

デフォルトで,実体の中には,正しくないあるいは知識ベースにまだ含まれていないために解釈できないものがある.このような場合は,解釈の代りに文字列が返される:

VerifyInterpretationを使って解釈できない実体を除外する:

アプリケーション  (6)

単語および文の分割  (2)

単語の分割は,電子メールアドレス,URL,Twitterのハンドル名のような文法要素を保存する:

"Word"または"Punctuation"の形式では,空白文字以外のすべての文字が拾われる:

文の分割は,頭字語やその他の紛らわしい境界を知的に無視する:

品詞  (2)

指定された品詞の全単語を返す:

品詞からワードクラウドの表を作る:

実体と解釈可能なオブジェクト  (2)

国を求める:

解釈された文字列をEntityオブジェクトとして返す:

Wikipediaの記事中の通貨金額を求める:

通貨金額を求める:

特性と関係  (1)

TextPositionTextCasesTextContentsと同じタイプを扱い,指定されたタイプについて常にこれらの関数と同じ部分文字列を識別する:

TextCasesTextPositionの一般化である:

Wolfram Research (2015), TextPosition, Wolfram言語関数, https://reference.wolfram.com/language/ref/TextPosition.html (2019年に更新).

テキスト

Wolfram Research (2015), TextPosition, Wolfram言語関数, https://reference.wolfram.com/language/ref/TextPosition.html (2019年に更新).

CMS

Wolfram Language. 2015. "TextPosition." Wolfram Language & System Documentation Center. Wolfram Research. Last Modified 2019. https://reference.wolfram.com/language/ref/TextPosition.html.

APA

Wolfram Language. (2015). TextPosition. Wolfram Language & System Documentation Center. Retrieved from https://reference.wolfram.com/language/ref/TextPosition.html

BibTeX

@misc{reference.wolfram_2024_textposition, author="Wolfram Research", title="{TextPosition}", year="2019", howpublished="\url{https://reference.wolfram.com/language/ref/TextPosition.html}", note=[Accessed: 25-November-2024 ]}

BibLaTeX

@online{reference.wolfram_2024_textposition, organization={Wolfram Research}, title={TextPosition}, year={2019}, url={https://reference.wolfram.com/language/ref/TextPosition.html}, note=[Accessed: 25-November-2024 ]}