CreateSemanticSearchIndex
该功能需要外部账户 »
CreateSemanticSearchIndex[source]
从 source 中的数据创建搜索索引.
CreateSemanticSearchIndex[source,"name"]
为搜索索引指定名称.
更多信息和选项
- CreateSemanticSearchIndex 用于从文本中提取可用来对内容进行语义搜索的特征.
- source 可取的值有:
-
"string" 纯字符串 File["path"] 单个文件 URL["url"] "url" 的文本表示 CloudObject[…] 云对象 LocalObject[…] 本地对象 {obj1,obj2,…} 对象列表 - 可对资源添加标记;可能的值包括:
-
{obj1val1,…} 向量和关联的值组成的列表 {obj1,…}{val1,…} 向量和值之间的规则 - 可接受的 vali 的形式包括:
-
"string" 字符串标签 <"tag1"v1,… > 标签和元数据值组成的关联 - CreateSemanticSearchIndex 支持以下选项:
-
DistanceFunction EuclideanDistance 使用的距离函数 FeatureExtractor "SentenceBERT" 如何从文本片段中提取特征 GeneratedAssetLocation $GeneratedAssetLocation 索引的位置 Method Automatic 方法的详细信息 OverwriteTarget Automatic 是否覆盖现有位置 ProgressReporting $ProgressReporting 是否报告计算进度 WorkingPrecision "Real32" 浮点计算的精度 - DistanceFunction 可取的值包括 EuclideanDistance、SquaredEuclideanDistance、CosineDistance、JaccardDissimilarity 和 HammingDistance.
- FeatureExtractor 可取的值包括:
-
"SentenceBERT" 基于 SentenceBERT 的本地模型 f 自定义的提取函数 - 自定义的提取函数 f 必须在字符串列表上进行操作并生成相同长度的向量列表.
- 通过 Method<opt1val1 > 给出选项. opti 可取的值有:
-
"ContextPadding" 项之间的最小重叠 "MaximumItemLength" 文本片段的最小长度 "MinimumItemLength" 文本片段的最大长度 "SplitPattern" Automatic 在哪里分割长字符串 - 设为自动的 "SplitPattern" 尝试将 text 拆分为段落、换行符和单词,创建长度位于 "MinimumItemLength" 和 "MaximumItemLength" 之间的片段.
- WorkingPrecision 可能的设置包括:
-
"Integer8" 从 到 127 的有符号 8 位整数 "Real32" 单精度实数 (32-bit) "Real64" 双精度实数 (64-bit)
范例
打开所有单元关闭所有单元基本范例 (1)
创建一个新的 SemanticSearchIndex:
选项 (4)
Wolfram Research (2024),CreateSemanticSearchIndex,Wolfram 语言函数,https://reference.wolfram.com/language/ref/CreateSemanticSearchIndex.html.
文本
Wolfram Research (2024),CreateSemanticSearchIndex,Wolfram 语言函数,https://reference.wolfram.com/language/ref/CreateSemanticSearchIndex.html.
CMS
Wolfram 语言. 2024. "CreateSemanticSearchIndex." Wolfram 语言与系统参考资料中心. Wolfram Research. https://reference.wolfram.com/language/ref/CreateSemanticSearchIndex.html.
APA
Wolfram 语言. (2024). CreateSemanticSearchIndex. Wolfram 语言与系统参考资料中心. 追溯自 https://reference.wolfram.com/language/ref/CreateSemanticSearchIndex.html 年