株式会社テクトス

Htmlのリンク先を取得する [ Html Gather Link]

Webサイトの一つのページから、HTMLを取得して、そのページからリンクしているページのリンク先をリストにします。

自動巡回ソフトや、リンク切れチェックなど、様々なソフトへ応用することができます。

○使い方

リンク先を調べたいサイトの場所を"URL"に入力します。

サイト内リンクなどの相対パスを絶対パスに変換す場合には、"CovAbsolutePass"をONにします。(デフォルトはON)

重複したURLを取り除く場合には、"CheckOverlap"をONにします。(デフォルトはON)

実行すると、"Link URL"にリンク先のURLのリストが表示されます。

サンプルプログラム VI"HtmlGatherLink.zip"(LabVIEW ver. 8.6版)ダウンロード

コネクタ画像

フロントパネル画像

○仕組み

リンクを調べる対象は、aタグのherf属性、linkタグのhref属性、frameタグのsrc属性の3種類です。

最初に、リンク先の情報をリストにして、次に、絶対パスの変換、URLの重複の削除を順に処理しています。

ブロックダイアグラム画像1