Jak przenosiliśmy SYUX-a, czyli synonimy.ux.pl

Ile razy mieliście tak, że chcieliście zrobić coś lepiej, a przez dłuższy czas dostawaliście po głowie, że popsuliście? Przecież — jak wiadomo — lepsze jest wrogiem dobrego. A czy lepsze jest wrogiem Dobrego słownika? Na to nie odpowiemy, za to obnażymy się całkiem w poniższym wpisie. Nie wiem, czy uwierzycie we wszystko to, co napisane zostanie poniżej. Ja sam nie mogę uwierzyć…

No dobrze, wytłumaczmy to jeden raz na początku. Wyobraźcie sobie, że wymyślacie cudowną, niezwykłą generację kosmetyków kwiatowych. Z niewielkim zespołem dopieszczacie procedurę produkcji, jeden z was nawet doktoryzuje się na kierunku „cudowne kosmetyki kwiatowe”. Samodzielnie, z pasją, bez uciekania się do pieniędzy z dotacji czy od inwestorów, stawiacie minifabrykę. Załatwiacie zezwolenia, wprowadzacie zasady BHP, automatyzujecie produkcję, organizujecie zamówienia, znów załatwiacie zezwolenia (po drodze zmieniło się prawo), organizujecie dystrybucję. Na kampanię reklamową nie macie pieniędzy. Ale jeden z was prowadzi drobną, acz cenioną, sieć sklepów z kosmetykami z forsycji. Sieć jest w stagnacji, choć ma swoich wiernych klientów.

forsycje

I teraz tak, zadbaliście o milion rzeczy, harowaliście jak woły, ale w tym wirze zdarzeń zapomnieliście trochę o wiernych klientach sieci forsycjowej. Wprowadzaliście nowe, wspaniałe kosmetyki, ale tylko kilka z nich było z forsycji.

Jaki mógł być efekt? Zobaczcie poniżej.

Za szybko przepięliśmy SYUX-a do Dobrego słownika

SYUX-em nazywamy skrótowo dawny słownik synonimy.ux.pl. Krótko o nim i jego historii przeczytacie na końcu wpisu w rozmowie z Marcinem Miłkowskim. Wdrażaliśmy dane tego słownika do Dobrego słownika. Powoli, bo od razu je weryfikowaliśmy. Nie poszliśmy tu na łatwiznę.

Ale zamknęliśmy dawną stronę, choć danych przenieśliśmy tylko część. Użytkownik dawnego SYUX-a poczuł się ubogo. Już nie unosił się zapach forsycji. Co najlepsze, część użytkowników wyemigrowała do innych serwisów… klonów SYUX-a w Internecie. Takie klony powstawały i powstają, gdyż synonimy.ux.pl wcześniej, a obecnie synonimy z Dobrego słownika są dostępne w ramach wolnych (darmowych) licencji. Służą m.in. w pakiecie LibreOffice.

Dziś już prawie wszystkie dane są przeniesione. I to w lepszej jakości. Niektóre poprawki były znaczne, spójrzmy tylko na dwa poniższe ciągi „synonimów” obecne w SYUX-ie:

przekłuć — przeszyć; idiota; przebić; przewiercić; ukłucie; ukłuć; przeniknąć; kłuć; penis; prześwidrować; przedziurawić

Biernat — abnegat; stara rura; jawnogrzesznica; bladź; wszetecznica

Niektóre poprawki były niewielkie, np.

rozstawiać — rozkładać; roztasować; rozmieścić; ustawiać; rozlokować; rozdysponować

miało część bliskoznacznych czasowników w aspekcie dokonanym (samo rozstawiać jest niedokonane), zatem lista powinna wyglądać tak:

rozstawiać — rozkładać; roztasowywać; rozmieszczać; ustawiać; rozlokowywać; rozdysponowywać

Tak czy owak weryfikacja danych z synonimy.ux.pl była ogromną pracą. I to się chwali.

Niestety, prócz zbyt szybkiego przepięcia SYUX-a, zrobiliśmy jeszcze gorszy błąd:

Nie zakomunikowaliśmy odpowiednio użytkownikom SYUX-a, że…

Dobry słownik jest słownikiem nowego typu, a nie tylko poprawką starego słownika, że
Dobry słownik nie jest jedynie odświeżonym SYUX-em, lecz całkiem nowym serwisem. Jest poradnią połączoną ze słownikiem (a w zasadzie z wieloma słownikami), co daje większe możliwości, a nie tylko oferuje wyszukiwanie synonimów.

Wydaje się, że to już sporo błędów związanych z przenosinami SYUX-a? Swoje dołożyła jeszcze niefortunna fortuna, zmieniając boleśnie

Przekierowanie na starcie

Wyobraźcie sobie, że z dotychczasowego adresu synonimy.ux.pl zrobiliśmy przekierowanie na strony Dobrego słownika. Przekierowania rządzą się swoimi prawami, których do dzisiaj nie pojąłem (ale ja jestem nietechniczny). Domeny, DNS-y, propagacja itd. Wszystko byłoby dobrze, gdyby nie to, że na serwerze synonimy.ux.pl stała też strona skrablowego klubu z Wrocławia „Siódemka”. Efekt był taki, że coś zbytnio gdzieś zabulgotało i los wybrał sobie stronę przekierowania jak na poniższym obrazku. Osoba szukająca synonimów trafiała na coś takiego:

zle_przekierowanie_scrabble

Gorzej nie będzie

Wszystko to opisane powyżej powodowało, że sam sposób prezentacji synonimów w nowym słowniku już tak nie bolał. Rozbudowanie haseł o inne potrzebne osobom piszącym informacje sprawiło, że już nie wszystkie synonimy pokazywały się czytelnie na jednym ekranie. Trzeba było przewijać po podgrupach.

Ale będzie lepiej

Przejrzeliśmy, poprawiliśmy i uporządkowaliśmy dane. A to tylko początek, bo słownik będzie cały czas rozwijany. Większość użytkowników SYUX-a nie miało pojęcia, że słownik ten od dawna był martwy, niczego w nim nie przybywało ani ubywało. Dobry słownik rośnie w imponującym tempie, co można śledzić w kolejnych podsumowaniach miesiąca.

Dalsza rozbudowa słownika wyrazów bliskoznacznych będzie następowała zatem w Dobrym słowniku. Z czasem, mamy nadzieję, poprawi się też funkcjonalność wyszukiwania samych synonimów (które zawsze będą oferowane w otwartym dostępie).

Przypominamy przy okazji,  że w hasłach można zgłaszać błędne lub brakujące bliskoznaczniki (link [zgłoś poprawkę] na dole po lewej stronie każdego hasła i podhasła):

zglos_poprawke_milosc

A co na to Marcin Miłkowski?

Łukasz Szałkiewicz (Dobrysłownik.pl): Skąd się wziął SYUX? Powiedz też coś o jego rozwoju.

Marcin Miłkowski (doktor habilitowany w zakresie filozofii, zajmuje się też różnymi aspektami lingwistyki komputerowej, zwłaszcza leksykografią): Wziął się stąd, że Daniel Naber stworzył oprogramowanie OpenThesaurus i wpadł na błyskotliwy pomysł. Otóż słowniki wielojęzyczne wymieniają synonimy jako odpowiedniki haseł obcojęzycznych. Wystarczy obciąć główki haseł, a zostaje słownik synonimów, który wystarczy potem przejrzeć.

W przypadku niemieckiego było stosunkowo łatwo, bo istniał wolnodostępny słownik angielsko-niemiecki. Ja musiałem użyć kilku różnych słowników, czasem dosyć egzotycznych, ale wszystkich albo w domenie publicznej, albo na licencji GPL.

I się udało. Chaos był większy, ale po kilku latach pracy ręcznej — głównie mojej, niestety — było już całkiem nieźle.

— Kto najwięcej pomagał, ile to było osób?

Nie pamiętam, lista jest dostępna w historii systemu. Osób było pewnie kilkaset, ale tych najaktywniejszych zapewne kilkadziesiąt. Niektórzy byli bardzo pomocni.

— Czy SYUX był potem faktycznie rozwijany? Kiedy stanął, choć można było zgłaszać nowe synonimy? Od kiedy już zgłaszać nowych nie można było, choć nikt nie protestował?

Był, przez kilka lat, a potem pojawiła się Neostrada, użytkownicy obniżyli loty i zaczęli psuć, zamiast poprawiać. Na pewnym etapie nowi użytkownicy dopisywali tylko wulgaryzmy do losowo wybranych haseł. Poprawianie po nowych zajmowało więcej czasu niż praca konstruktywna.

Wiele osób też miało problem ze wychwyceniem różnicy między synonimem – wyrażeniem, które można podstawić z zachowaniem tego samego znaczenia, a przynajmniej prawdziwości całego zdania  — a wolnym skojarzeniem.

Ale stosowałem też inne metody, np. sprawdzałem listy częstości wyszukań haseł, patrzyłem po słowniku frekwencyjnym (tym stareńkim). To było w wiki dołączonym do systemu słownika.

— Jakie błędy widzisz w przeniesieniu (przenoszeniu) SYUX-a do DS?

Nie widzę hierarchii haseł. To dawało posmak Wordnetu.

— Dlaczego warto było przenieść synonimy.ux.pl do Dobrego słownika?

PHP poszło do przodu i panel administracyjny nie działał, a za serwer UX nie chciał już płacić.

A głównie dlatego, mówiąc poważniej, że już do poprawy haseł wymagane były kompetencje dosyć duże, większe niż u przeciętnego użytkownika komputera. Tu trzeba było specjalistów. I dlatego DS daje większą szansę na rozwój — co już dzisiaj widać.

Poniżej komentują tylko osoby, którym słowa wulgarność, hejterstwo, czepialstwo, spamowanie są znane wyłącznie z definicji w Dobrym słowniku. Inni muszą wiedzieć, że mamy nożyczki i nie zawahamy się ich użyć.

  • aztechowski

    Z tym przekierowaniem na stronę Siódemki to już było prawo serii, w myśl zasady „Jak się #@%@#$, to na całego”

    • Anarchimedes

      ale to bardzo ładna strona 😉

      • aztechowski

        @opoq:disqus: w końcu to Ty ją zrobiłeś 🙂