30000文字の謎(シリーズ:MURAGON)
1つ前の記事、勢いにまかせて下書きを書きなぐって(というか打ちなぐって)いたら、長くなってしまった。
そうして投稿してみたら、また「記事本文は30000文字以内にしてください」というようなメッセージが出て、投稿できなかった。
えー、また分けなきゃいけないのか。でもこの話は途中で分けるっていってもなー。
と少し削ったりしてみたが、まったくどうにもならない。
しかし今回もまた、下書きしているWord側の文字カウントは10000文字にも満たない。6500文字くらいだった。
やはりこれはおかしい。
Wordに入力した文章をいったんメモ帳にコピーし、それをMURAGONの「記事を書く」にコピーしてみたら、問題なく投稿できた。
まずはこの「投稿可」「不可」について、結論を出してしまおう。
前回も30000文字を超えていないのに「30000文字以内で」と言われて、後からチラッと「もしかしてWordだからか?」と思ったが、もう2つに分けてしまっていたのでスルーしてしまった。
ご存知のようにWindows付属の「メモ帳」というソフトは、テキストエディタ。
プログラムコードとかHTMLコードのような、書式不要(むしろ入れられては困る)のものを書くときに使うエディタ。
そういうときWordなどは使ってはいけないのだ。Wordというのは、自動的に裏側で書式設定などのさまざまなコードが書かれるからだ。
HTMLについての説明で、昔よく言われていた説明風に言うと、
画面上、赤い文字で「こんにちは」と見えている文字は、実際は赤字で書かれているというわけではない。
こんにちは というHTMLが書かれているのである。
ってこと。
HTMLタグというのは、簡単に言えば
<開始タグ>この部分が文章この部分が文章この部分が文章終了タグ>
という構造になっている。
で始めたら、で終わる。その間の部分は、指示されたとおりになる(赤字とか)。
今どきのバージョンでは、こんな直接ここに「font color=red」なんて書き込まない。
HTMLはマークアップだけ (ここからここが大見出し、ここが小見出し、ここが段落、というような構造を定義することのみする)
CSSでそれぞれのマークアップ部分に書式設定する (大見出し(h1)と指定されている部分は文字色青、段落(p)と指定されている部分は背景色緑、というようにHTMLと組み合わせて指定する)
だがまあ、昔は分かりやすい説明として、赤字が例によく使われたのだ。
Wordなどのアプリケーションで作成した文書も、「Webページとして保存」などすると、自動的にHTML文書になる。
範囲選択して、リボンのボタンで赤くした文字が、自動的に「ここが文章だよここが文章だよ」とHTMLになる。
つまりWordで作成された文章には、目に見える文字以外にも、実に多くの情報が含まれているのである。
――もしかしてMURAGONの言ってる「30000文字」って、こういう情報も含まれてるんじゃ??
たぶんそういうことなんだろう。もしくはそれに似たなんらかの事情なのだろう。
ほかのブログでも同じようなことはあるのだろう。
(seesaaはない。fc2もない。Bloggerはあった。)
さて、それなら次からはメモ帳で下書きすればいいかもしれない。
画像をつけたい場合は、これはよろしくない。
テキストエディタは画像を表示できないからだ。あくまでもシンプルに文字(テキスト)のみなのである。
でもわたしはそれほど画像を使わない。
が、改行がうまく反映されないのである。
こちらは1行改行しただけなのに、MURAGONにコピーすると3行分も4行分も空いたり、すべての空白行がなくなったりする。
今思ったのだが、これをわたしは改行コードが理由なのだと思っていた。
Windows CR(キャリッジリターン) 行を改める
linuxなど LF(ラインフィード) 行を送る
という、同じ改行でも違うコードが使われていることによる不具合だと思ってきた。
でももしかしたら違うかも。
なくなるという場合はそうかもしれないけれど、1つしか入れていないところに3つ4つとやたら改行が増えるのは、HTMLタグの不都合なのかも。
HTMLでは、ただ改行しても改行にならない。
(ブレイク)というタグを入れて初めて改行になる。
ところでWordで改行というのは「段落」を意味する。
Wordの左端の選択領域と呼ばれるところで、
ワンクリックすると 1行単位で選択
ダブルクリックすると 段落単位で選択
トリプルクリックすると 文書全体を選択
となるが、たとえばダブルクリックして「段落単位」で選択してみると分かる。
改行の段落記号があるところまでが「1段落」なのだ。1行でも「1段落」、100行でも「1段落」。とにかく段落記号から段落記号までが「1段落」だ。
段落記号っていうのは、改行したところに出てくる、くるっとまがったような矢印のこと。
つまりである。
わたしが「行を改めたい」と思って改行していることで、「ここからここまで段落」という設定をしたことになってしまっている。
HTMLでは段落は
(パラグラフ)だ。
から
までが「1段落」なのだ。わたしが改行したところには
ではなく
が設定されているのかも。
HTMLでpタグを入れると、その段落の前後に若干の空白ができる。ちょうど1行くらい空けたように見えるのである。
だから改行を入れると3行分くらいに増えてしまうのかもしれない。
で、これをメモ帳で書いてコピーすると・・・・・・今度はまったく空かないのだ。
改行してもくっついて表示されてしまって、どこに入れてあった?と下書きを見ながら改めて入れている始末。
しかしまあ、これからは、改行を入れ直すのが面倒ではあるが、メモ帳にいったんコピーすればよいことが分かった。
それにしても、文章が長くなるような日記をつけるのに、このブログを選んだのは間違った選択だったかなぁ?
※これまたWordで下書きして、そのままコピペしてみたのだが、いいことにも気づいた。
MURAGONはそのままタグが表示されている。
ブログによっては、タグがそのままHTMLタグとして認識されてしまうことがある。(というか多くがそうだ。)
たとえば以下のように説明したかった場合、
-----------------------------------------------
文章を
と
で囲めば、そこが段落になるのである。-----------------------------------------------
-----------------------------------------------
文章を
と
で囲めば、そこが段落になるのである。
-----------------------------------------------
と表示されてしまうのだ。
そこでタグ部分を全角にするとか、そもそも記事全部をスクリーンショット画像にするとか、工夫が必要になるのだ。
HTMLを解説しているサイトなど大変だったと思うが、MURAGONなら便利かもしれない。