Statistiky webových stránek
V následující tabulce jsou uvedeny statistiky různých technologií používaných na webových stránkách. Pro lepší přehlednost a snadnější interpretaci výsledků jsme použili různé barvy pozadí, které označují přesnost detekce jednotlivých technologií a dalších informací.
Legenda barev:
- Zelená: Vysoká přesnost detekce (např. WordPress, Shoptet, Google Analytics)
- Světlá zelená: Střední přesnost detekce (např. WooCommerce)
- Oranžovo-žlutá: Nízká až střední přesnost detekce (např. Joomla, Webnode, Wix)
- Tmavě oranžová: Specifické funkce (např. Consent V2, HTTPS(u neaktivních domén je dostupný certifikát))
Popis | Počet |
---|---|
Celkový počet domén | 973961 |
Mrtvé weby | 639761 |
Používá Shoptet | 21166 |
Používá WordPress | 166920 |
Používá WooCommerce | 62603 |
Používá Joomla | 9672 |
Používá Drupal | 0 |
Používá Webnode | 4520 |
Používá Wix | 8907 |
Používá Shopify | 799 |
Používá PrestaShop | 1858 |
Měří statistiky | 188725 |
Používá Google Analytics | 129661 |
Používá GTM | 83679 |
Consent V2 | 5673 |
Používá HTTPS | 390422 |
1. Identifikace použití CMS (Content Management System)
- WordPress: Funkce
containsWordPress($html)
hledá specifické indikátory v HTML, jako jsou výskytywp-includes
awp-content
v hlavičce stránky. - Joomla: Funkce
containsJoomla($html)
hledá meta taggenerator
s hodnotouJoomla! - Open Source Content Management
. - Drupal: Funkce
containsDrupal($html)
hledá meta taggenerator
s hodnotouDrupal
. - WooCommerce: Funkce
containsWooCommerce($html)
hledá výskyty specifických řetězců, jako jsouwoocommerce
,wc-
,woocommerce-message
,woocommerce-cart
awoocommerce-checkout
. - Shoptet: Funkce
containsShoptet($html)
prohledává HTML obsah na indikátory specifické pro Shoptet, napříkladhttps://cdn.myshoptet.com/prj/
,shoptet_config
,shoptet.dataLayer.push
ashoptet.consent.onAccept
. - Webnode: Funkce
containsWebnode($html)
hledá meta taggenerator
s hodnotouWebnode
. - Wix: Funkce
containsWix($html)
hledá meta taggenerator
s hodnotouWix.com Website Builder
. - Shopify: Funkce
containsShopify($html)
hledá specifický link tag s hodnotouhttps://cdn.shopify.com
. - PrestaShop: Funkce
containsPrestaShop($html)
hledá meta taggenerator
s hodnotouPrestaShop
.
2. Kontrola HTTPS
- Kontrola HTTPS: Funkce
isHttps($url)
zjišťuje, zda URL používá HTTPS protokol.
3. Kontrola měřících nástrojů
- Google Analytics: Funkce
checkGoogleAnalytics($html)
hledá přítomnost URL obsahujícíchhttps://www.googletagmanager.com/gtag/js
,https://www.google-analytics.com/analytics.js
nebohttps://www.google-analytics.com/ga.js
. - Google Tag Manager: Funkce
checkGoogleTagManager($html)
hledá přítomnost URL obsahujícíchhttps://www.googletagmanager.com/gtm.js
nebogoogletagmanager.com/gtm.js
. - Režim souhlasu: Funkce
checkConsentMode($html)
hledá řetězecgtag("consent", "default")
.
4. Extrahování kontaktů
- E-mail: Funkce
findEmailAndPhone($html, $domain)
extrahuje e-mailové adresy z HTML obsahu pomocí regulárních výrazů hledající anchor tagy smailto
nebo samotné e-mailové adresy. - Telefonní číslo: Funkce
findEmailAndPhone($html, $domain)
také extrahuje telefonní čísla z HTML obsahu pomocí regulárních výrazů hledající anchor tagy stel
nebo samotné telefonní čísla.
5. Identifikace unikátních domén
- Unikátní domény: Funkce
getUniqueDomains($html, $currentDomain)
extrahuje všechny odkazy (anchor tagy) z HTML a identifikuje unikátní domény, které se liší od aktuální domény.
Závěr
Tento skript systematicky analyzuje HTML obsah webových stránek a identifikuje různé technologie a klíčové informace pomocí specifických funkcí, které hledají charakteristické řetězce a tagy pro dané technologie. Tímto způsobem lze určit, jaké CMS nebo měřící nástroje web používá, zda používá HTTPS, a také získat kontaktní údaje, jako jsou e-mailové adresy a telefonní čísla.