SemanticImport

SemanticImport[file]

Datasetオブジェクトを与えるために,ファイルを意味的にインポートしようとする.

SemanticImport[file,type]

ファイル中のすべての要素を,指定されたタイプのものとして解釈しようと試みる.

SemanticImport[file,{type1,type2,}]

連続する列の要素を,指定されたタイプのものとして解釈しようと試みる.

SemanticImport[file,col1->type1,col2->type2,]

位置または名前で指定された列 coliのみを保存する.

SemanticImport[file,typespec,form]

結果を指定された形で与える.

詳細とオプション

  • SemanticImport[file]fileFile["path"]として,あるいは単に"path"で指定することができる.
  • SemanticImportは,主として,一次元および二次元の要素配列に使われることを意図している.
  • SemanticImportは,自由形式の言語を使い,要素を与えられた構造の中で解釈する.
  • 返されるオブジェクトのタイプには,数,Quantityオブジェクト,Entityオブジェクト,DateObjectGeoPositionオブジェクト等がある.
  • SemanticImportは,入力の特定の行あるいは列中のすべての要素を見ることで,例えば日付形式等の詳細な仮定を立てる.
  • type の可能な値
  • Automatic自動的にタイプを選ぶ
    "String"Unicode文字列
    "Number"任意の標準形式による数
    "Integer"十進表記による整数
    "Real"十進表記による実数
    "Quantity"単位付きの数量
    "Currency"通貨量
    "Date"任意の標準形式による日付
    "DateTime"日付と時刻
    "Time"一日のうちの時刻
    "GeoCoordinates"経緯度で指定される地理位置
    "URL"正しくフォーマットされたURL
    "EmailAddress"正しくフォーマットされた電子メールのアドレス
    "Country"自然言語で与えられた国
    "City"自然言語で与えられた都市
    None列を飛ばす
    ispecInterpreterが使用する任意の基本形
  • 入力の特徴を示すために次のオプションを与えることができる.
  • CharacterEncoding Automatic入力ファイルで想定されるエンコーディング
    Delimiters Automatic要素間のデリミタ
    HeaderLines Automaticヘッダとして扱う行番号
    ExcludedLines {}結果から除外する行
    MissingDataRules {}「missing」であるとみなされたデータの置換規則
  • form の可能な値
  • "Dataset"行指向のデータ集合
    "List"リストとしての単一列
    "Columns"各列がリストとして与えられる列のリスト
    "NamedColumns"列名をコンテンツのリストと関連付ける連想
    "Rows"各行がリストとして与えられる行のリスト
    "NamedRows"各行が列の名前からコンテンツへの連想として与えられる,行のリスト
  • 要素が解析できないときに代りに返される形式
  • Missing["Empty"]空あるいは空白要素
    Missing["Invalid","string"]無効な,あるいは意味のないフィールドのあるデータ
    Missing["Unrecognized","string"]解析できない要素
    Missing["ByDesignation",value]MissingDataRulesにマッチする要素
    Missing[custom]MissingDataRulesを通して与えられたMissing[]

例題

すべて開くすべて閉じる

  (7)

自動的に都市と日付を検出し,それを解釈しながら,ファイルをインポートする:

太字で表示された列は,Wolfram言語の意味的オブジェクトに相当する:

指定された列のタイプがあるファイルをインポートする:

列数を使い,ファイルのいくつかの列だけを指定されたフォーマットでインポートする:

列の名前を使い,ファイルのいくつかの列だけを,指定されたフォーマットでインポートする:

削除されるべき列にはNoneを指定して,いくつかの列だけをインポートする:

行のリストとしてファイルをインポートする:

列のリストとしてファイルをインポートする:

スコープ  (3)

指定された文字コードを使ってファイルをインポートする:

指定されたデリミタを使ってファイルをインポートする:

インポートするファイルの第1行をヘッダにするように指定する:

ファイルの第1行および第5行を飛ばすように指定する:

欠落値を特殊形式Missing["UnknownData"]の形式"Unknown"で返す:

オプション  (7)

SemanticImportオプションはSemanticImportStringオプションの多くを使う.詳しくはSemanticImportStringの例題を参照のこと.

CharacterEncoding  (1)

文字コードを間違うとよい解釈も狂うことがある.Unicodeで符号化されたデータファイル作る:

デフォルトの文字コードでデータをインポートする:

文字コードにUnicodeを指定してデータをインポートする:

Delimiters  (1)

デリミタを指定すると,値をどのように区切るのかが決まる:

存在しないデリミタを指定すると,新規行で区切られた1列の項目になる:

ExcludedLines  (1)

行は,ヘッダが選択される前,あるいはさらに処理される前に,行列の行番号で除外される.次は生のデータである:

ヘッダ行が奇数順位を偶数行に入れたので,偶数番号の行を除外すると,奇数順位の建造物が与えられる:

HeaderLines  (1)

ヘッダとして扱うファイル中の行数を指定する:

MissingDataRules  (2)

「Sears」で始まる文字列を「Willis Tower」で置換する:

規則は解釈の前に適用される:

アプリケーション  (6)

ロンドンから多くの国への航空料金をDatasetオブジェクトとしてして含む表をインポートする:

ロンドンの地理的位置を得る:

航空料金の最高額を得る:

航空料金の最高額を赤で,最低額を青で示した航空路線図を作る:

個人の電子メールのタイムラインについてのデータをインポートする:

「family」のカテゴリに含まれる値を得る:

月ごとの電子メール数をプロットする:

大学教員の給与表から第1および第3列をインポートする:

結果をプロットする:

日付と数値からなるデータ集合をDatasetオブジェクトとしてインポートする:

データを行のリストとして得る:

データが文字列として解釈されるように指定する:

著名な建築物とその特性のリストを含むデータ集合をDatasetオブジェクトとしてインポートする.都市と国はEntityオブジェクトとして自動的に検出される:

著名な建築物のデータ集合から,名前,国,高さの列のみをインポートする:

考えられる問題  (3)

自動選択ではInterpreterタイプよりも貧弱なタイプ集合から選択する:

明示的なタイプを指定して,文字列ではなくEntityオブジェクトをインポートする:

Automaticタイプは,自動的に選択された列数を指定する:

{Automatic}タイプは,自動的に選択されたタイプの1列を指定する:

タイプリスト中のAutomaticは,対応する列に連続して適用される:

デフォルトのAutomatic選択によるヘッダ行は,データが行で並んでいるか列で並んでいるかによって正しくないことがある:

ヘッダ行の数を明示的に指定して,データを正しくインポートするようにする:

Wolfram Research (2014), SemanticImport, Wolfram言語関数, https://reference.wolfram.com/language/ref/SemanticImport.html (2016年に更新).

テキスト

Wolfram Research (2014), SemanticImport, Wolfram言語関数, https://reference.wolfram.com/language/ref/SemanticImport.html (2016年に更新).

CMS

Wolfram Language. 2014. "SemanticImport." Wolfram Language & System Documentation Center. Wolfram Research. Last Modified 2016. https://reference.wolfram.com/language/ref/SemanticImport.html.

APA

Wolfram Language. (2014). SemanticImport. Wolfram Language & System Documentation Center. Retrieved from https://reference.wolfram.com/language/ref/SemanticImport.html

BibTeX

@misc{reference.wolfram_2024_semanticimport, author="Wolfram Research", title="{SemanticImport}", year="2016", howpublished="\url{https://reference.wolfram.com/language/ref/SemanticImport.html}", note=[Accessed: 18-November-2024 ]}

BibLaTeX

@online{reference.wolfram_2024_semanticimport, organization={Wolfram Research}, title={SemanticImport}, year={2016}, url={https://reference.wolfram.com/language/ref/SemanticImport.html}, note=[Accessed: 18-November-2024 ]}