✍️ テキスト・文章

HTMLからテキスト抽出

HTMLを貼るだけで、タグを取り除いて本文のプレーンテキストだけを取り出します。改行・箇条書き・  なども自然な形に整えるので、そのままメールやメモに貼れます。処理はブラウザ内で完結します。

例(クリックで試す)
HTMLを貼ると、ここに本文テキストが出ます

HTMLからテキスト抽出ツールの使い方

はじめての方は「例(クリックで試す)」を押してみてください。サンプルHTMLが入り、抽出結果がすぐ表示されます。あとは上のテキストエリアにHTMLソースを貼り付けるだけ。貼り付けたその場で抽出されるライブ動作です。リンク先URLも残したいときは「リンクのURLを残す」にチェックを入れてください。

具体例:箇条書きを含むHTML

次のようなHTMLを貼り付けると:

<h2>できること</h2>
<p>Benri は&nbsp;登録不要・無料です。</p>
<ul><li>JSON整形</li><li>QR作成</li></ul>

こう抽出されます(タグは除去、箇条書きは行頭記号付き、&nbsp; は半角スペースに):

できること

Benri は 登録不要・無料です。

- JSON整形
- QR作成
  • タグ除去:HTMLタグを取り除き、本文テキストだけを残します。<script><style> の中身は対象外です。
  • 改行の整形<br> は改行に、段落・見出し・<div> などのブロックは前後で改行にします。
  • 箇条書き<li> に「- 」(<ol> では「1. 」)を付けます。
  • 実体参照&nbsp;&amp;&lt; などはブラウザの解釈どおり実際の文字に戻します。
  • リンクのURLを残す:オンで <a> のテキストの後ろに(URL)を併記します。

こんな場面で便利です

  • HTMLメールやWebページの本文だけをコピーしてメモに貼りたいとき
  • 装飾タグだらけのリッチテキストをプレーンテキストに落としたいとき
  • 文字数を数える前に、まずタグを除いて本文だけにしたいとき(文字数カウントと合わせてどうぞ)

逆に文字をHTMLエスケープしたいときは HTMLエスケープ/アンエスケープ をどうぞ。

よくある質問

入力したHTMLはサーバーに送信されますか?
いいえ。タグ除去とテキスト抽出の処理はすべてお使いのブラウザ内で完結し、入力したHTMLが外部に送信・保存されることはありません。メール本文や社内資料のHTMLでも安心してご利用いただけます。
改行や箇条書きはどう扱われますか?
<br>は改行に、段落や見出し・<div>などのブロック要素は前後で改行に変換します。<li>は「- 」(番号付き<ol>では「1. 」)の行頭記号を付け、&nbsp;は半角スペースに直します。連続する空行は最大1行にまとめて、自然なプレーンテキストにします。
リンクのURLは残せますか?
はい。「リンクのURLを残す」をオンにすると、<a>のテキストの後ろに(URL)の形でリンク先を併記します。オフのときはリンクのテキストだけを残します。