Bu yazımda PHP Simple HTML DOM Parser kullanımı anlatacağım. Öncelikle adresinden kütüphanemizi indirelim. İçerisinden simple_html_dom.php dosyasını çıkartalım ve kullanmak istediğimiz dosya yoluna ekleyelim.


<?php


include "simple_html_dom.php";


Kütüphanemizi dahil ettikten sonra file_get_html fonksiyonuna veri çekeceğimiz adresi giriyoruz. Ben kendi GitHub adresimden repolarımın başlıklarını çekeceğim.


<?php


include "simple_html_dom.php";


$html = file_get_html('https://github.com/kemalmutlu?tab=repositories');


echo $html;

Bu kodu çalıştırdığımız zaman ekrana GitHub profilimi yükleyecektir. Başlıkları çekmek için F12 tuşuna basayalım ve geliştirici araçlarını açalım. Aşağıda ki adımı çekmek istediğiniz verilere uygulayabilirsiniz.



Ben başlıkları çekmek istediğim için herhangi bir başlığa tıkladım ve ortak kullanılan tag ve classları inceledim. Başlıklar h3 tagı ve wb-break-all classlarını ortak kullandıkları için aşağıda ki işlemle devam ettim.

<?php


include "simple_html_dom.php";


$html = file_get_html('https://github.com/kemalmutlu?tab=repositories');


$titles = $html->find('h3[class=wb-break-all]');


foreach($titles as $title):
    echo $title->plaintext . "<br>";
endforeach;

find() fonksiyonu çektiğim html kodlarından h3 tagına ve wb-break-all class'ına sahip olan verileri dizi haline getirdi. Bu diziyi $titles'a atadık ve foreach ile döndük. Platintext bize html kodlarından arınmış şekilde sadece yazıyı getirdi. Eğer h3 içerisinde ki a taglarını almak isteseydik innertext kullanabilirdik.


Daha fazlası için dökümantasyonunu inceleyebilirsiniz.