SSブログ

改行解除とパラグラフ保存とインデント(字下げ)の頭の体操 [Marginalia 余白に]

記事「改行解除(ワード) How to Remove Line Breaks (Microsoft Office Word)」と「RLB: Remove Line Breaks」の余白に。 

あとのほうの記事の最後に「パラグラフを残してその他の改行を解除するにはどうしたらいいのかしら。頭の体操をしてみよう。」と書きました。

ちゃんと知ってる人は知ってるんだろうなあ、と思いつつ、しかし恥じることもなく頭の体操をしてみる。

いちおう例題(実験台)として Full text of"Tanglewood Tales" [Project Gutenberg] @ Internet Archive <http://www.archive.org/stream/tanglewoodtales00976gut/tnglw10.txt>

☆第零段階
ワードにコピペしてctl[Ctrl; control]+ H [or F] などで検索・置換ダイアログを開ける。

☆第一段階
・検索する文字列―  ^13{2,}
・置換後の文字列―  テクスト内で使われていない文字をひとつ、あるいは念のためふたつ、たとえば##
・検索オプション―  ワイルドカードを使用するにチェックを入れる
・この条件ですべて置換(837個の項目を置換)

〔{2,} はその前の要素が2回以上を表わす。^13 は改行だけど、1個だけだと見た目行間が空かない改行(つまり^13 が2回あるのは行間が空いている)〕

☆第二段階
・検索する文字列―  ^13
・置換後の文字列―  スペース半角分ひとつ  
・検索オプション―  なし(ワイルドカードを使用するのチェックはあってもなくても同じ)
・この条件ですべて置換(5444個の項目を置換)

第三段階
・検索する文字列―  第一段階の文字(列)、たとえば##
・置換後の文字列―  ^13      ^13とパラグラフ冒頭のインデントしたい分のスペース、たとえば5個  
・検索オプション―  ワイルドカードを使用するのチェックはあってもなくても同じ
この条件ですべて置換(837個の項目を置換)

  これは、自分の感じからすると、オオカミだかキツネだかがいるけどウサギとニワトリを向こう岸に舟一艘で渡す頭の体操に似ている。

  でも、よく見ると、グーテンベルグの冒頭の説明のところは改行がもともとヘンなので、そこはきれいに統一されないです。あと、段落のインデント(字下げ)は別途設定してもいいかも。

  ワイルドカードの ! =「否定」の利用も考えたのですけれど、英語だとうまくいかなかった。勉強しよっと。

2011年3月16日午前1時ごろ追記――ちなみに第一段階を経ないで第二段階の置換を行なうと7151個の置換が行なわれる。7151=5444+837×2 ではない。5444+837×2=7118 すなわち改行マークは3以上で連続している箇所があるということかな。


nice!(0)  コメント(0)  トラックバック(0) 
共通テーマ:学問

nice! 0

コメント 0

コメントを書く

お名前:
URL:
コメント:
画像認証:
下の画像に表示されている文字を入力してください。

トラックバック 0

津波 Tsunami Surgeエイシー AC ブログトップ

この広告は前回の更新から一定期間経過したブログに表示されています。更新すると自動で解除されます。