そういうときには正規表現による抽出や置換が簡単です。
ダウンロード
筆者は文字コード、改行コード変換、正規表現による置換にとても重宝しています。
フォルダ全対象になってくると、TextWranglerを利用した一括置換をしてるんですけどね。
利用例:dtタグデータをXML変換
<dt>2015/01/22</dt>
<dd><a href="◯◯">タイトル</a></dd>のHTMLデータを下記のXMLデータに変換したい
<item>
<date>2015/01/22</date>
<title>タイトル</title>
<url>◯◯</url>
</item>
※<date>, <title>, <url>の前は、タブを1ついれることとする