名前: anonymouse 日時: 2006-06-06 00:59:54 IPアドレス: 85.195.119.*
>>43293 >>43290 >>43280 #順序がバラバラですが、 > 私が当初考えていたのは、完成したPDF原稿から > Unicode でコピペできることが目的でしたので、出力 > したフォントが Unicode でエンコードされているこ > とが必要なんだと思います。多分、ソースコートの記 > 述と出力と両方が Unicode なものを私は探している > のだと思います。 Adobe Readerは、フォントの埋め込み方にもよりますが、 大雑把に言って、欧文等の8bitフォントの場合、個別の グリフのpostscript名で、和文等の多byteフォントの場合、 フォントの持つエンコーディングで、各文字のUnicode値を 取得しようとします。Adobe Reader自身があらかじめ 知っている、グリフ名や、エンコーディングは限られて いますが、toUnicode CMapと呼ばれるリソースが、PDFに 埋め込まれていれば、どのような、グリフ名、エンコーディング が使われていようが、文字列の検索や、コピー&ペーストは 問題なく行えます。 TeXから、PDFを作成する場合、dviドライバーが何であるかが、 大きく影響します。例えば、dvipdfmxの場合、標準的な 設定のフォントを使う限り、toUnicode CMapは必要な時に 限り、自動的に生成されて、PDFファイルに埋め込まれますが、 それ以外の設定でも、比較的容易にユーザーが用意した toUnicode CMapを埋め込んで、文字列の検索を可能にしたり、 他のアプリケーションとの連係を容易にする事が可能です。 一方、dvips+ps2pdfを使うと、toUnicode CMapをコントロール する事は事実上不可能です。pdftexについては知りません。 > 私もInDesignもIllustratorも持っていますが(私は理 > 系です),数式はUnicodeテキストにコピー&ペースト > できても意味がありません。同じ平方根の記号でも正し > い大きさになっていないと意味がありませんので。 これはコピー側とペースト側のアプリケーションが、共通の フォーマットで数式を一次元化(文字列化)し、解釈できるか どうかの問題だろうと思います。latexならば、例えば、 \[ \sqrt{\left(\frac{dx}{dt}\right)^{2}+\left(\frac{dy}{dt}\right)^{2}} \] と言った文字列を見れば、\sqrtの部分は平方根記号を意味し、 残りの部分はその引数であると解釈して、平方根記号の大きさを 調節してくれますが、代りにmathMLの文字列を食わせても エラーを吐くだけです。テキストエディターならば、AUCTeXの プレビューモードでもない限り、適切な大きさの平方根を 表示したりはしてくれませんが、文字列としては、正しく 解釈してくれるので、コピー&ペーストには充分に意味が あります。 PDFには数式を一次元化する機能はないので、ただ、単に 見掛けの位置に因って、目に見える文字のみ並べるだけなので、 無意味な文字列しか得られないだけでしょう。 ご存知だと思いますが、MS Office2007ではMicrosoftの 研究員である、Leslie Lamportばかりでなく、Donald Knuthからも全面的な協力を得た、数式整形機能が売り物の 一つになっていますが、ここで採用される、ファイル フォーマットのみならず、ユーザー入力や、コピー& ペーストにも対応した、数式のUnicode文字列表現を 標準規格化する事が画策されています。 Unicode Nearly Plain Text Encoding of Mathematics #preview-latexのAUCTeXに関わらない部分に関しては #wikiに書き込めない訳でもないですけれど、どなたか、 #AUCTeXに関わる部分を書いて下さる方、いらっしゃいますか? > また、非常に恥ずかしい素人の質問になりますし、 > このサイトの主旨とは反するかも知れませんが、個人 > 的には(価格の問題は置いておいて)InDesign 等が > 存在する現在、それでもあえて TeX を使うメリット > と言うのはどういうものがあるのか、いまいち、よく > 理解できません。いちいちタグを打ち込む方法では、 > 論文等をシームレスに執筆するのには向いていないよ > うな気もしてしまうのですが、多分、それは TeX を > きちんと理解していないからだと思います。あるい > は、InDesign があれば、あえて TeX を使う必要はな > いのか? そこの所なども併せてご教示いただければ > と思います。 生のデータの持つ情報には様々な要素があります。きれいに 印刷できるよう、読みやすく画面に表示できるように、整形 すると言うのは、情報の持つある要素を表現したものです。 一方、データを統計処理する事で現れて来る結果は、ただ 単純に整形したのでは抜け落ちてしまう情報の側面を表現 しているかも知れません。特定の表示(view)に依存しすぎない ように、生のデータ(model)を情報化する事は、データの 再利用性を高めると考えられます。 論文等の、印刷目的でしか使わないファイルでも、内容と 見てくれを意識的に分けて考えておけば、発表する雑誌が 変わり体裁を変更しなければならない、プレゼンテーション用 スライドを作らなければならない、Webで公開したくなった、 と言った事態にも対応が簡単なはずです。もちろん、WYSIWYG ツールでも、「誘惑」に負けずにスタイルシートを使っていれば、 これは同じように簡単に実現可能ですけれど。 しかし、再定義可能なタグを使い、執筆時には内容に専念し、 見てくれを整える作業は完全に分離してしまった方法の方が、 気を散らさないで済む分、特別な訓練を受けた人でない限り、 生産的だろうと思われます。 > 私も個人的に辞書などを作っているのですが、これ > も InDesign よりも TeX で作ってしまった方がいい > のでしょうか? 辞書を作るとなると、単一のツールだけでは処理しきれない 作業が多数出て来るはずです。このような場合、proprietary なフォーマットでも処理できる、出来合いのツールや プラグインが手に入れば、良いのですが、そうでない場合、 いざとなれば、自作のスクリプトでも対応できる、テキスト フォーマットの強みは無視できないように思います。
この書き込みへの返事: