Internet, to biblioteka aleksandryjska XXI wieku. Narzędzie to pozwala na prosty dostęp dla każdego do całej wiedzy świata. W ostatnich latach dodatkowo dobrze służy mniejszym regionom w archiwizacji i promocji ich kultury oraz historii, a wszystkim, którzy będą chcieli zagłębić się w temat historii swojego własnego regionu łatwo to umożliwia. Jednakże w dobie sztucznej inteligencji oraz „oszukiwania” wyszukiwarek internetowych w celu masowego tworzenia taniej treści by zarabiać na wyświetleniach reklam, jakość wiedzy serwowanej w internecie może stać się wątpliwa. W trakcie przeszukiwania odmętów internetu w celu wyszukiwania rozmaitych źródeł do opracowań historycznych, które możecie państwo przeczytać na naszej stronie, natrafiałem na strony internetowe, które imitowały portale regionalne w celach zarabiania na wyświetleniach i kliknięciach reklam na tychże stronach. Jednocześnie jednak serwowały zwykłą dezinformację i przekłamane fakty.
Nieuczciwe „portale lokalne”
Piszę ten tekst, żeby nie tylko przybliżyć problem, ale także zaprezentować jak uważać na tego typu strony internetowe oraz jak skutecznie i bezpiecznie szukać prawdziwej wiedzy na temat naszego regionu w internecie. Zaprezentuję w tym celu przykład takiej nieuczciwej strony internetowej. Jedną z takich stron jest ziemiadobrzynska.pl, która już po samym adresie URL strony może nie wzbudzić większych podejrzeń. Jest jednak parę cech tej strony, które powinny spowodować zapalenie się w głowie przysłowiowej czerwonej lampki ostrzegawczej. Pierwszą w nich są treści na głównej stronie witryny. Żadna z nich w najmniejszym stopniu nie dotyczy Ziemi Dobrzyńskiej. Tematyka treści jest całkowicie różnorodna, co może wskazywać na próbę dotarcia do jak najszerszego grona odbiorców za pośrednictwem jak największej różnych ilości wyszukiwanych fraz w wyszukiwarkach internetowych. Brakuje też nazwisk autorów tych publikacji.
Przyjrzyjmy się w takim razie artykułom, które mają prezentować informacje bezpośrednio dotyczące regionu ziemi dobrzyńskiej. Jako przykład wybiorę artykuł poświęcony wsi Zarzeczewo położonej obok włocławskiego Zawiśla, gdyż wiedzę w tym artykule przedstawioną najłatwiej będzie można samodzielnie zweryfikować. Jedynym poprawnym elementem w całym artykule zdaje się być obrazek wyróżniający prezentujący zabytkowy dwór, będący siedzibą oddziału Kujawsko-Pomorskiego Ośrodka Doradztwa Rolniczego w Minikowie. Jednak „im dalej w las” tym gorzej. Pierwszy akapit tekstu zawiera dużo ogólnikowych informacji, które byłyby poprawne dla większości polskich wsi, nie tylko usytuowanych w naszej części kraju. O wiele ciekawiej się robi w momencie, gdy przejdziemy do dalszej części tekstu.

Każdy, kto był chociaż raz w Zarzeczewie, zapytany o jego atrakcje oraz zabytki, w pierwszej kolejności wskazałby marinę nad zalewem, wspomniany wcześniej dwór wraz z tzw. rządcówką sąsiadującą z pętlą autobusową. Pozycje te jednak nie zostały wymienione w artykule. Zamiast tego dowiadujemy się o bliżej nieznanym kościele klasycystycznym z 1807 roku oraz tajemniczym cmentarzu z 1692 roku. Poza tym dowiadujemy się także, że turyści z całej Polski będą mieli okazje odwiedzić zamek z XIII, liczne muzea, galerie oraz… Jaskinie. Również rzucić się w oczy może pojawiające się non stop określenie „miasto” w stosunku do Zarzeczewa, które oczywiście żadnym miastem nie jest. Raczej każda osoba z Włocławka czytając ten artykuł może mieć w głowie dwa słowa komentarza: „stek bzdur”. Nie muszę raczej tłumaczyć, że w tym artykule nie zgadza się nic i jest on tylko i wyłącznie losowym zlepkiem informacji niewiadomego pochodzenia. W jaki sposób jednak mógł powstać tak bardzo niezgodny z prawdą artykuł, że aż miejscami zabawny?
A.I. i sieci portali
Prawdopodobnie treści publikowane na „portalu” nie zostały napisane przez człowieka, a są generowane za pomocą sztucznej inteligencji hurtowo niczym na taśmie produkcyjnej. Zwróćmy uwagę na brak nazwiska autora przy żadnym z tekstów na portalu. Ktoś jednak mógłby zapytać: „Przecież modele sztucznej inteligencji jak ChatGPT nie popełniają takich błędów i mają dostęp do zasobów internetowych. Skąd więc tyle błędów w tym artykule?”. Dobrą poszlaką niech będzie data publikacji tego artykułu. Modele sztucznej inteligencji rozwijają się w tempie zastraszającym, a usługi pokroju ChataGPT mają dostęp do internetu w darmowej wersji dopiero od niedawna.
Kto jest w takim razie właścicielem tego portalu? Jedyne informacje, jakie możemy na temat witryny uzyskać znajdują się na stronie polityki prywatności, na której czytamy, że portal ten jest częścią większej sieci Publicate.pl, zarejestrowanej w Bielsku-Białej. Strona internetowa tej sieci również jest uboga w większą ilość informacji na jej temat, lecz jeśli wierzyć tym podawanym, to Publicate.pl posiada ponad 300 portali internetowych, prawdopodobnie zalewającymi internet podobnymi błędnymi lub wygenerowanymi przez A.I. treściami. Treściami, których jedynym celem jest „oszukanie” algorytmów wyszukiwarek internetowych tanimi metodami, żeby dotrzeć do jak największego grona odbiorców. Liczą się przede wszystkim słowa klucz w najgęstszej ilości wraz z każdą możliwą ich formą odmiany. Kuba Orlik i Arkadiusz Wieczorek z fundacji „Internet. Czas Działać” nazywają ten proceder mianem „SEO Bełkotu”, o czym poczytać można w tym artykule: www.internet-czas-dzialac.pl/seo-belkot.
O ile mieszkańcy naszego regionu nie powinni nabrać się za tego typu bzdury, tak takie strony są szkodliwe dla turystów z innych regionów Polski, którzy poszukiwali by informacji na temat naszego regionu wraz z jego atrakcjami turystycznymi. Z tego powodu zwalczanie takich treści powinno leżeć w naszym interesie.
Przy okazji tematu sztucznej inteligencji pragnę zwrócić uwagę także na inny problem. Coraz więcej ludzi odchodzi od szukania informacji w serwisie Wikipedia czy w wyszukiwarkach internetowych, jak Google czy Bing na rzecz korzystania z ChatGPT. Zauważamy to także na przykładzie naszej strony internetowej, gdzie od początku roku do naszej strony ze strony chatgpt.com odnotowaliśmy już 8 przekierowań. O ile na dzień dzisiejszy modele językowe takie jak ten oferowany przez ChatGPT przy okazji prostych zapytań są skuteczne, tak w przypadku szukania dokładniejszej wiedzy nt. regionu i jego historii potrafią pojawiać się błędy lub tzw. halucynacje A.I., czyli stworzone fałszywe lub często nielogiczne informacje.
Szukanie rzetelnych informacji w internecie
Podobnych stron internetowych imitujących portale lokalne z pewnością jest o wiele więcej. Jak w takim razie skutecznie wyszukiwać informacje nt. naszego regionu? Przede wszystkim należy korzystać ze sprawdzonych źródeł informacji. Jest wiele polskich serwisów dostarczających dużą ilość informacji nt. kultury, historii czy atrakcji turystycznych regionów Polski, jak np. Zabytek.pl, zawierający dużą ilość danych nt. zabytków w całym kraju. Innym serwisem jest Kujawsko-Pomorska Bibilioteka Cyfrowa pod adresem kpbc.umk.pl, która zawiera bardzo dużą ilość archiwalnych źródeł w formie cyfrowej umożliwiając za pomocą wyszukiwarki znajdywanie źródeł zawierających wyszukiwane frazy w tytule lub treści. Dodatkowo oferuje dużą ilość parametrów filtrowania, jak przedział czasowy czy miejsce wydania. W przypadku szukania w innych źródłach internetowych należy zwracać uwagę nie tylko na samą treść wybranego materiału, lecz także na przytaczane źródła informacji.