HTML (.html,.htm)

予備知識

    • 登録MIMEタイプ:text/html
    • HTMLマークアップ言語とファイル形式.
    • Webページ作成のための主要言語.
    • HTMLはHypertext Markup Languageの頭文字である.
    • プレーンテキスト形式.
    • Webページの構造と外観を記述する.
    • Internet Engineering Task Force (IETF) working draftとして1993年に初めて発行された.
    • 1996年以降はWorld Wide Web Consortium (W3C)によって管理されている.
    • W3C推奨として1996年に最新版4.01が発行された.
    • 国際標準ISO/IEC 15445:2000.
    • XHTMLが後継している.

ImportとExport

  • Import["file.html"]はHTMLファイルをプレーンテキストで表示する.
  • Import["file.html","Data"]はHTMLより表データを抽出する.
  • Export["file.html",expr]expr のHTML版を作成する.
  • Export["dir",expr]expr をHTMLに移行し,出力を指定されたディレクトリに保存する.
  • Import["file.html"]はプレーンテキストのファイルのコンテンツを表す文字列を返す.
  • Export["file.html",expr]はノートブックセル,セルのリストや他のノートブック要素をHTMLにエキスポートする.
  • Exportは常に完全なHTMLドキュメントを作成し,部分的なHTMLを作成することはない.
  • 出力は1個以上のHTMLファイルとHTMLFilesとHTMLLinksの2つのディレクトリである.
  • Wolfram言語は,HTMLにエキスポートするとき,デフォルトでタイプセット式をGIFイメージに変換する.
  • Wolfram言語はTooltipHyperlink式をHTMLに変換することができ,必要な場合はHTMLイメージマップを作成する.
  • Import["file.html",elem]は指定された要素をHTMLファイルからインポートする.
  • Import["file.html",{elem,suba,subb,}]はサブ要素をインポートする.
  • Import["file.html",{{elem1,elem2,}}]は複数の要素をインポートする.
  • インポートの形式はImport["file","HTML"]またはImport["file",{"HTML",elem,}]と指定できる.
  • Export["file.html",expr, elem]expr が要素,elem を指定するものとして扱うことにより,HTMLファイルを作成する.
  • Export["file.html",{expr1,expr2,},{{elem1,elem2,}}]では,それぞれのexpri が対応するelemiを指定するものとして扱われる.
  • Export["file.html",expr,opt1->val1,]expr を特別の値を持つオプションが指定されたものとしてエキスポートする.
  • Export["file.html",{elem1->expr1,elem2->expr2,},"Rules"]は規則を使い,エキスポートされる要素を指定する.
  • 一般的な情報は,以下の関数ページを参照のこと.
  • Import, Exportファイルからインポートする,あるいはファイルへエキスポートする
    CloudImport, CloudExportクラウドオブジェクトからインポートする,あるいはクラウドオブジェクトへエキスポートする
    ImportString, ExportString文字列からインポートする,あるいは文字列へエキスポートする
    ImportByteArray, ExportByteArrayバイト配列からインポートする,あるいはバイト配列へエキスポートする

ノートブックインターフェース

  • 選択範囲の形式保存」はノートブックの選択された箇所をWebページとしてエキスポートできる.
  • 別名で保存」はノートブック全体をWebページにエキスポートできる.

Import要素

  • 一般的なImport要素:
  • "Elements" ファイル中の有効な要素とオプションのリスト
    "Summary"ファイルの概要
    "Rules"使用可能なすべての要素の規則のリスト
  • Import要素:
  • "Data"HTMLテーブル,リスト要素からのテキスト,数値コンテンツ
    "FullData"空のHTMLテーブルとリスト要素を含めた完全な表形式の内容
    "Hyperlinks"文字列のリストとして与えられるハイパーリンク
    "Images"HTMLドキュメントに埋め込まれた画像
    "Plaintext"テキストとしてフォーマットされたHTMLドキュメント
    "Source"単一の文字列としての生のHTMLソース
    "Title"HTMLページタイトル
    "ImageLinks"埋め込まれた画像のURL
    "XMLObject"ドキュメント全体の記号XML表記
  • Import はデフォルトで"Plaintext" 要素を使う.
  • HTMLドキュメントを"XMLObject"としてインポートするとき,Wolfram言語は整形式のXHTMLに変換しようとし,その結果のXMLファイルをインポートする.
  • Export要素:
  • "Notebook"Notebook
    "NotebookObject"NotebookObject
    "Expression"任意のWolfram言語式

オプション

  • Importオプション:
  • CharacterEncodingAutomaticファイルをインポートする際に使用する生の文字コード
    "Numeric"True可能な場合にデータフィールドを数としてインポートするかどうか
  • HTMLファイルでファイルの文字規格が指定されていない場合,ImportCharacterEncodingで指定された規格を使う.可能な文字コード規格の一覧は$CharacterEncodingsによって与えられている.
  • CharacterEncoding->Automaticとすると,ImportはHTMLファイルで指定されている符号化方式を使用する.指定されていない場合は,"UTF8"符号化を使用する.ファイルに保存されているバイト列で"UTF8"では解釈できないものがある場合は,"ISOLatin1"を使用する.
  • Wolfram言語はHTMLにエキスポートするときは,常にUTF-8 規格を使う.
  • Exportオプション:
  • "Content"FalseMathMLコンテンツ要素をエキスポートするかどうか
    "ConversionRules"Automaticインラインとブロックレベル要素双方のマークアップを含むWolfram言語のセルスタイルからHTML要素へのマッピングを指定するかどうか
    "ConvertClosed"True前向きに閉じられたセルグループをエキスポートするかどうか
    "ConvertLinkedNotebooks"FalseリンクされているノートブックをHTMLに変換するかどうか
    "ConvertReverseClosed"False後向きに閉じられたセルグループをエキスポートするかどうか
    "CSS"Automatic使用するまたはリンクするCSSスタイルシート
    "FullDocument"True完全なHTMLドキュメントをエキスポートするかどうか
    "Graphics3DOutput"Automatic3Dグラフィックス式の表し方
    "GraphicsOutput""GIF"グラフィックス式の表し方
    "HeadAttributes"{}規則のリストとして与えられるHTML <head> タグに挿入される属性
    "HeadElements"{}HTML <head> タグのサブ要素
    "ManipulateOutput""CDF"Manipulate式の表し方
    "MathOutput""GIF"タイプセット式の表現の方法
  • "GraphicsOutput""Graphics3DOutput""ManipulateOutput""MathOutput"の可能な設定:
  • "CDF"対象の式をCDFに変換する
    "DisplayForm"対象の式を概観のASCII近似に変換する
    "GIF"対象の式をGIFに変換する
    "InputForm"対象の式をそのInputFormに変換する
    "PNG"対象の式をPNGに変換する
    "JPEG"対象の式をJPEGに変換する
    "SVG"対象の式をSVGに変換する
  • "MathOutput"->"MathML"はすべてのタイプセット式をMathMLに変換する
  • "Graphics3DOutput"->Automaticは3Dグラフィックスを"GraphicsOutput"に対して指定されたのと同じメソッドを使って変換する.
  • 出力変換に使用するオプションは,セルのトップレベルのオブジェクトのタイプに基づく.例えば2Dグラフィックスだけを含むセルは"GraphicsOutput"を使い,タイプセット式やコードに埋め込まれた2Dグラフィックスを含むセルは"MathOutput"を使用する.
  • "CSS"の可能な設定:
  • AutomaticWolframシステムのスタイルシートからCSSスタイルシートを作成する
    NoneスタイルシートファイルまたはインラインCSSスタイルを作成しない
    "file.css"スタイルシートファイルを使用する
  • "ConvertClosed""ConvertReverseClosed"の可能な設定:
  • False閉じられたグループをエキスポートしない
    Trueすべてのセルグループをエキスポートする
    "LinkedPage"個々の前向きに閉じられたグループを別のページにエキスポートする

例題

すべて開くすべて閉じる

  (3)

Webページから全画像をインポートする:

HTMLファイルをプレーンテキストとして読む:

このファイルで可能なImportの要素を表示する:

このファイルから表コンテンツをインポートする:

数式をHTMLにエキスポートする:

"HTMLFiles"ディレクトリに保存されているファイルの名前を表示する:

ラスタライズされたタイプセットされた式をインポートする:

スコープ  (5)

Cell式をHTMLに変換する:

Wolframシステムはツールチップとハイパーリンクの埋め込まれているグラフィックスをHTMLイメージマップにエキスポートできる:

Wolframシステムのスタイル要素からHTMLへのマッピングは"ConversionRules"で指定できる:

フォーマットされたテーブルをHTMLにエキスポートする:

HTMLフラグメントを作成する: