HTML (.html,.htm)
予備知識
-
- 登録MIMEタイプ:text/html
- HTMLマークアップ言語とファイル形式.
- Webページ作成のための主要言語.
- HTMLはHypertext Markup Languageの頭文字である.
- プレーンテキスト形式.
- Webページの構造と外観を記述する.
- Internet Engineering Task Force (IETF) working draftとして1993年に初めて発行された.
- 1996年以降はWorld Wide Web Consortium (W3C)によって管理されている.
- W3C推奨として1996年に最新版4.01が発行された.
- 国際標準ISO/IEC 15445:2000.
- XHTMLが後継している.
ImportとExport
- Import["file.html"]はHTMLファイルをプレーンテキストで表示する.
- Import["file.html","Data"]はHTMLより表データを抽出する.
- Export["file.html",expr]は expr のHTML版を作成する.
- Export["dir",expr]は expr をHTMLに移行し,出力を指定されたディレクトリに保存する.
- Import["file.html"]はプレーンテキストのファイルのコンテンツを表す文字列を返す.
- Export["file.html",expr]はノートブックセル,セルのリストや他のノートブック要素をHTMLにエキスポートする.
- Exportは常に完全なHTMLドキュメントを作成し,部分的なHTMLを作成することはない.
- 出力は1個以上のHTMLファイルとHTMLFilesとHTMLLinksの2つのディレクトリである.
- Wolfram言語は,HTMLにエキスポートするとき,デフォルトでタイプセット式をGIFイメージに変換する.
- Wolfram言語はTooltipとHyperlink式をHTMLに変換することができ,必要な場合はHTMLイメージマップを作成する.
- Import["file.html",elem]は指定された要素をHTMLファイルからインポートする.
- Import["file.html",{elem,suba,subb,…}]はサブ要素をインポートする.
- Import["file.html",{{elem1,elem2,…}}]は複数の要素をインポートする.
- インポートの形式はImport["file","HTML"]またはImport["file",{"HTML",elem,…}]と指定できる.
- Export["file.html",expr, elem]はexpr が要素,elem を指定するものとして扱うことにより,HTMLファイルを作成する.
- Export["file.html",{expr1,expr2,…},{{elem1,elem2,…}}]では,それぞれのexpri が対応するelemiを指定するものとして扱われる.
- Export["file.html",expr,opt1->val1,…]はexpr を特別の値を持つオプションが指定されたものとしてエキスポートする.
- Export["file.html",{elem1->expr1,elem2->expr2,…},"Rules"]は規則を使い,エキスポートされる要素を指定する.
- 一般的な情報は,以下の関数ページを参照のこと.
-
Import, Export ファイルからインポートする,あるいはファイルへエキスポートする CloudImport, CloudExport クラウドオブジェクトからインポートする,あるいはクラウドオブジェクトへエキスポートする ImportString, ExportString 文字列からインポートする,あるいは文字列へエキスポートする ImportByteArray, ExportByteArray バイト配列からインポートする,あるいはバイト配列へエキスポートする
Import要素
- 一般的なImport要素:
-
"Elements" ファイル中の有効な要素とオプションのリスト "Summary" ファイルの概要 "Rules" 使用可能なすべての要素の規則のリスト - Import要素:
-
"Data" HTMLテーブル,リスト要素からのテキスト,数値コンテンツ "FullData" 空のHTMLテーブルとリスト要素を含めた完全な表形式の内容 "Hyperlinks" 文字列のリストとして与えられるハイパーリンク "Images" HTMLドキュメントに埋め込まれた画像 "Plaintext" テキストとしてフォーマットされたHTMLドキュメント "Source" 単一の文字列としての生のHTMLソース "Title" HTMLページタイトル "ImageLinks" 埋め込まれた画像のURL "XMLObject" ドキュメント全体の記号XML表記 - Import はデフォルトで"Plaintext" 要素を使う.
- HTMLドキュメントを"XMLObject"としてインポートするとき,Wolfram言語は整形式のXHTMLに変換しようとし,その結果のXMLファイルをインポートする.
- Export要素:
-
"Notebook" Notebook式 "NotebookObject" NotebookObject式 "Expression" 任意のWolfram言語式
オプション
- Importオプション:
-
CharacterEncoding Automatic ファイルをインポートする際に使用する生の文字コード "Numeric" True 可能な場合にデータフィールドを数としてインポートするかどうか - HTMLファイルでファイルの文字規格が指定されていない場合,ImportはCharacterEncodingで指定された規格を使う.可能な文字コード規格の一覧は$CharacterEncodingsによって与えられている.
- CharacterEncoding->Automaticとすると,ImportはHTMLファイルで指定されている符号化方式を使用する.指定されていない場合は,"UTF8"符号化を使用する.ファイルに保存されているバイト列で"UTF8"では解釈できないものがある場合は,"ISOLatin1"を使用する.
- Wolfram言語はHTMLにエキスポートするときは,常にUTF-8 規格を使う.
- Exportオプション:
-
"Content" False MathMLコンテンツ要素をエキスポートするかどうか "ConversionRules" Automatic インラインとブロックレベル要素双方のマークアップを含むWolfram言語のセルスタイルからHTML要素へのマッピングを指定するかどうか "ConvertClosed" True 前向きに閉じられたセルグループをエキスポートするかどうか "ConvertLinkedNotebooks" False リンクされているノートブックをHTMLに変換するかどうか "ConvertReverseClosed" False 後向きに閉じられたセルグループをエキスポートするかどうか "CSS" Automatic 使用するまたはリンクするCSSスタイルシート "FullDocument" True 完全なHTMLドキュメントをエキスポートするかどうか "Graphics3DOutput" Automatic 3Dグラフィックス式の表し方 "GraphicsOutput" "GIF" グラフィックス式の表し方 "HeadAttributes" {} 規則のリストとして与えられるHTML <head> タグに挿入される属性 "HeadElements" {} HTML <head> タグのサブ要素 "ManipulateOutput" "CDF" Manipulate式の表し方 "MathOutput" "GIF" タイプセット式の表現の方法 - "GraphicsOutput","Graphics3DOutput","ManipulateOutput","MathOutput"の可能な設定:
-
"CDF" 対象の式をCDFに変換する "DisplayForm" 対象の式を概観のASCII近似に変換する "GIF" 対象の式をGIFに変換する "InputForm" 対象の式をそのInputFormに変換する "PNG" 対象の式をPNGに変換する "JPEG" 対象の式をJPEGに変換する "SVG" 対象の式をSVGに変換する - "MathOutput"->"MathML"はすべてのタイプセット式をMathMLに変換する
- "Graphics3DOutput"->Automaticは3Dグラフィックスを"GraphicsOutput"に対して指定されたのと同じメソッドを使って変換する.
- 出力変換に使用するオプションは,セルのトップレベルのオブジェクトのタイプに基づく.例えば2Dグラフィックスだけを含むセルは"GraphicsOutput"を使い,タイプセット式やコードに埋め込まれた2Dグラフィックスを含むセルは"MathOutput"を使用する.
- "CSS"の可能な設定:
-
Automatic WolframシステムのスタイルシートからCSSスタイルシートを作成する None スタイルシートファイルまたはインラインCSSスタイルを作成しない "file.css" スタイルシートファイルを使用する - "ConvertClosed"と"ConvertReverseClosed"の可能な設定:
-
False 閉じられたグループをエキスポートしない True すべてのセルグループをエキスポートする "LinkedPage" 個々の前向きに閉じられたグループを別のページにエキスポートする