ここでは、「DOM」について解説しています。スクレイピングを勉強する過程で「DOM」という言葉が出てきたので、調べたことをここにまとめています。
DOMとは
DOMとは「Document Object Model」の略です。XMLやHTMLの各要素にアクセスすることを指します。
DOM要素とは
DOM要素とは、HTML文書内の要素を表すオブジェクトのことです。DOM要素はJavaScriptからアクセス可能であり、JavaScriptを使って動的にHTML文書を変更することができます。
具体例を挙げると、以下のようなものがあります。
<div>
要素:HTML文書内で領域を定義するための要素です。<p>
要素:段落を表す要素です。<a>
要素:リンクを表す要素です。<img>
要素:画像を表す要素です。<ul>
要素:順序のないリストを表す要素です。<li>
要素:順序のないリスト内の要素を表す要素です。
これらの要素は、JavaScriptからDOM APIを使って取得し、プログラムで操作することができます。たとえば、以下のようなJavaScriptコードを書くことで、ページ内の<h1>
要素のテキストを変更することができます。
let heading = document.querySelector('h1');
heading.textContent = '新しい見出し';
DOM要素の属性とは
スクレイピングを勉強していると「DOM要素の属性」という言葉が出てきます。DOM要素の属性とは、タグ名の後にある各属性を指します。
例えば、<a>タグにおけるhrefなどを指します。
<a href="https://***" data-wpel-link="internal">プロフィール</a>