tex writerと文字コード

tex writerと文字コード

- rah mtk の投稿
返信数: 6
初めて質問させていただきます。よろしくお願いします。
普段はパソコンで原稿を作成しています(texworks、文字コードshift-JIS)。今日はたまたまiPadで編集しようと、Dropboxを介して、あるファイルをtex writerで開いてしました。 tex writerはshift-JISに対応していなくて、UTF8のみだと思うのですが、意識せず開いてしまい(ここですでに文字化け)、一瞬コンパイルボタンも押してしまいました。そのままDropboxのファイルも上書きされてしまい、パソコンの方へ戻ると文字化けしていました。初めは、UTF8で保存されただけかと思い、texworks下部の文字コードの変換をしてみましたが、うまくいきませんでした。
さらに、nkfも試したのですが、これもうまくいきません。(すでに文字化けした原稿ファイルをコピーして)試したのは、
1、nkf -g foo.tex (結果はutf8)
2、nkf -s foo.tex > foo2.tex
3、nkf -w ~
4、nkf -S -w ~
5、nkf -S -s ~
など、考えられる操作はしてみたのですが、うまくいきません。
どうにか文字を元に戻したいのですが、ご存じのことがありましたら、ご教授いただけると幸いです。よろしくお願いします。
(説明不足の箇所があり、追加しました。よろしくお願いします。)
rah mtk への返信

Re: tex writerと文字コード

- 本田 知亮 の投稿
なにもデータがないので
しようがないように思います

こういうときは
意図的にファイルを壊してみましょうよ

まず,

\documentclass{jarticle}
\begin{document}
あいうえお表
\end{document}

をSJISで保存して,これをバックアップしておいて
同じ操作で文字化けを発生させる.
「表」を入れているのは
SJISだと「0x5C」が紛れているから,
なんとなくです.

そのあと
(1) 化ける前のオリジナルのSJISファイル
(2) 化けてしまったファイル
(3) (1)をそのままUTF8に変換したファイル
この三者を比較してみれば,
何か分かるかもしれません


本田 知亮 への返信

Re: tex writerと文字コード

- rah mtk の投稿
お返事ありがとうございます。
早速やってみました。(2)は同様に文字化けしてしまいました。
しかし、(2)のファイルをtexworksのshift-JISで開くと、
「あいうえお」は文字化けしており、「表」はそのまま
表示されています。(UTF8で開くと、すべて文字化け)
(3)は問題なくUTF8に変換されています。
また、(関係ないかもしれませんが)
(4) (2)をnkf -s で変換
して、nkf -g で比較してみました。
(1) shift-JIS
(2) UTF8
(3) UTF8
(4) CP932
(1) (4)はどちらともshift-JISのことだと思っていましたが、
実は何か違いがあるのでしょうか?
ご助言いただけると幸いです。よろしくお願いします。
rah mtk への返信

Re: tex writerと文字コード

- 匿 名 の投稿
Dropboxのバージョン管理機能を使って,ファイルを差し戻せばよいと思います.
原因究明と対処法を理解しておきたい,というお考えでしたらお役に立てずすみません.
匿 名 への返信

Re: tex writerと文字コード

- rah mtk の投稿
ご教授ありがとうございます。早速やってみました。無事成功し、元のファイルを復元することができました。Dropboxにこのような機能があることを存じなかったので、今後も何かあれば活用していきます。(その前に、自分でしっかりバックアップを取るよう心掛けていきます。)
今回は、結果的にTeXに関する質問ではなくなってしまったこと、大変申し訳ありませんでした。しかし、iPadなどで日本語のTeXの入力をする場合は、文字コードに関する注意が必要であることがはっきり認識でき、勉強になりました。
今後ともよろしくお願いします。
(私は知識がないので原因究明まで辿り着くことはできませんでしたが、関連する情報がございましたら、引き続きご教示いただけると幸いです。)
rah mtk への返信

Re: tex writerと文字コード

- 若 雲 の投稿
Shift-JISに対応していないエディタでファイルを開き、文字化けした状態で保存した、ということですよね。

ファイルにはすでに文字化けした文字が、UTF-8で保存されてしまっているので、そこからの復旧は難しいのではないでしょうか。

以下と同じ状況ですよね?

"文字コードがShift-jisで保存されてたテキストのファイルを、誤って文字コードの設定をUTF8で開いてしまい、それに気がつかずUFT8の文字コードのまま保存してしまいました。そのため、文字コードをUTF8、Shift-jisでファイルを開いても文字化けしてしまいます。このような状態のファイルを再びShift-jis(またはUTF8)で正常に開けるようにはならないでしょうか?"
http://q.hatena.ne.jp/1205543730
若 雲 への返信

Re: tex writerと文字コード

- rah mtk の投稿
上記情報、ありがとうございます。まったく同じ状況です。Windows系とMac系の間では起こりそうな事態ですが、そのファイルからの完全復元はほぼ無理なのですね。とても勉強になりました。今後は特に注意しようと思います。(そういえば、以前にも同じような目に会ったことを思い出しました。そのときは、別の方から送られたきたファイルでやってしまったので、もう一度送り直してもらい、事なきを得ました。その方はMac系を使っています。今思えば、同様の状況でした。)
UTF8をデフォルトにしたほうが危険がなさそうですね。そもそもバックアップの大切さを学びました。本当にありがとうございました。