TextSummarize

この機能には次が必要です:外部アカウント »

TextSummarize[text]

text の要約を生成する.

TextSummarize[text, spec]

指定 spec に基づいてテキストを要約する.

TextSummarize[texttopic,spec]

topic にマッチする text 部分を要約する.

詳細とオプション

  • TextSummarizeはテキストの情報を圧縮する.
  • TextSummarizeは,外部サービスの認証,請求,インターネット接続を必要とする.
  • 長い文は短い断片に分割され,個別に要約(つまりマップ)されてから繋がれる(つまり削減される).
  • 次は,text の可能な値である.
  • "string"プレーンな文字列
    File["path"]個々のファイルまたはファイルのディレクトリ
    URL["url"]"url"のテキスト表現
    CloudObject[]クラウドオブジェクト
    LocalObject[]ローカルオブジェクト
    SemanticSearchIndex[]意味的索引が付いたテキスト
    {obj1,obj2,}オブジェクトのリスト
  • topic 指定は自由形式の文字列である.これを使って text の特定の点を選択することができる.
  • SemanticSearchIndex[]からの要約の生成には topic 指定が必要である.
  • 次は,spec の可能な値である.
  • "BulletPoints"簡潔でキーポイントとして提示される text の要約
    {"BulletPoints",n}n 個のキーポイントに含まれるの text の要約
    "Description"text を圧縮した形に言い換える(デフォルト)
    "Extracts"text のキーセンテンス
    "Keywords"重要度順になった text からのキーワード
    "KeywordSummary"外観順になった text からのキーワード
    "OneLineSummary"非常に圧縮されたアブストラクト
    "Rewrite"text のショートバージョン(スタイルは同じ)
    "Title"text の可能なタイトル
    "Topics"text の主なトピック
  • spec のカスタム値は以下を使って指定できる.
  • promptカスタム指定の説明
    {promptmap,promptreduce}map 部分と reduce 部分のプロンプトを分離する
  • promptiは以下の値をサポートする.
  • LLMPrompt["name"]リポジトリのプロンプト
    StringTemplate[]テンプレートテキスト
    TemplateObject[]テキスト作成のためのテンプレート
  • TextSummarizeは以下のオプションをサポートする.
  • InsertionFunctionAutomatic式の挿入前に適用する関数または形式
    CombinerFunctionStringJoinprompt 内の断片を繋ぎ合せるために適用する関数
    AuthenticationAutomatic明示的なユーザIDとAPIキー
    LLMEvaluator$LLMEvaluator使用するLLM設定
    Method Automaticメソッドの詳細
  • デフォルトのInsertionFunctionは,単一の断片についてはTextString,断片のリストについてはStringRiffle[#, "\n\n"]&である.
  • 詳細オプションはMethod<|opt1val1|>を使って与えられる.次は,optiの可能な値である.
  • "ContextWindow"テキスト断片の最大長
    "ContextPadding"断片間の最小重複
    "SplitPattern"Automatic長い文字列を分割する場所
  • 自動の"SplitPattern"は,text をパラグラフ,改行,単語で区切って"ContextWindow"より小さい断片にしようとする.
  • TextSummarizeは機械学習を使用する.含まれるメソッド,訓練集合,バイアスは,Wolfram言語のバージョンによって変化する可能性があるので,異なる結果を与えるかもしれない.

例題

すべて開くすべて閉じる

  (2)

ファイルのコンテンツを要約する:

一片のテキストを説明する主なキーワードを求める:

スコープ  (14)

入力タイプ  (5)

文字列を要約する:

ファイルを要約する:

URLを要約する:

オブジェクトのリストを要約する:

意味的に結果を要約する:

要約指定  (8)

テキスト内容の簡潔な説明を提供する:

テキストを圧縮された形式に書き換える:

提供されたテキストようにタイトルを考案する:

テキストを要約して1つの文にする:

テキスト内容を説明する主なキーワードを求める:

主なキーワードをテキストに表れる順に求める:

キーセンテンスを取り出すことで指定されたテキストを要約する:

箇条書きのリストを使って指定されたテキストを要約する:

リストの長さを指定する:

トピック指定  (1)

テキスト全体を要約する:

テキストのトピックと一致する部分だけを要約する:

オプション  (1)

Method  (1)

改行がない長い文字列は,空白で自動的に分割される:

章を分割するためにカスタムの分割パターンを定義する:

新たなテキストの断片を使って要約を計算する:

考えられる問題  (1)

SemanticSearchIndexからの要約は,トピックが指定されているときしか使えない:

Wolfram Research (2024), TextSummarize, Wolfram言語関数, https://reference.wolfram.com/language/ref/TextSummarize.html (2024年に更新).

テキスト

Wolfram Research (2024), TextSummarize, Wolfram言語関数, https://reference.wolfram.com/language/ref/TextSummarize.html (2024年に更新).

CMS

Wolfram Language. 2024. "TextSummarize." Wolfram Language & System Documentation Center. Wolfram Research. Last Modified 2024. https://reference.wolfram.com/language/ref/TextSummarize.html.

APA

Wolfram Language. (2024). TextSummarize. Wolfram Language & System Documentation Center. Retrieved from https://reference.wolfram.com/language/ref/TextSummarize.html

BibTeX

@misc{reference.wolfram_2024_textsummarize, author="Wolfram Research", title="{TextSummarize}", year="2024", howpublished="\url{https://reference.wolfram.com/language/ref/TextSummarize.html}", note=[Accessed: 22-November-2024 ]}

BibLaTeX

@online{reference.wolfram_2024_textsummarize, organization={Wolfram Research}, title={TextSummarize}, year={2024}, url={https://reference.wolfram.com/language/ref/TextSummarize.html}, note=[Accessed: 22-November-2024 ]}