Jump to content
korneliusz.com

Czyściciel list domen.

Recommended Posts

Kto zna jakiś doby czyściciel nazw domen, który nie obcina IDN-ów? Te z których korzystam są dobre tylko z nonIDN-ami.

Edited by sylyx.com

Share this post


Link to post
Share on other sites
Chodzi mi o program, albo stronę gdzie mogę wkleić wymieszany tekst z nazwami domen i otrzymać same nazwy domen.

 

no niestety, ale też szukam,. Znam tylko www.dncleaner.com, ale ten nawet nie wykrywa innych poza com, net, org, biz, info, us, co.uk, in, co.in, sc, tv, & cc

Share this post


Link to post
Share on other sites
Kto zna jakiś doby czyściciel nazw domen, który nie obcina IDN-ów? Te z których korzystam są dobre tylko z nonIDN-ami.

 

Nudzę się trochę, więc napiszcie jak to ma działać to może jutro będzie dostępne za darmo na czyściciel.pl

Share this post


Link to post
Share on other sites

Problem w tym, że estibot też nie radzi sobie z IDN-ami. Chyba, że masz wersję premium i w niej jest inaczej?

Nudzę się trochę, więc napiszcie jak to ma działać to może jutro będzie dostępne za darmo na czyściciel.pl

Zobacz jak to działa u konkurencji. Generalnie chodzi o to żeby np. z takiej postaci:

ewsbank.pl arch 2008-02-06 06:59:45 2009-02-21 06:59:45 2008-02-14 BLOCKED HOME

2 euroteltp.pl arch 2008-02-06 07:18:25 2009-02-21 07:18:25 2008-02-06 BLOCKED NetArt

3 euroteltp.com.pl arch 2008-02-06 07:20:26 2009-02-21 07:20:26 2008-02-06 BLOCKED NetArt

4 wwwgrono.pl arch 2008-02-06 07:20:56 2009-02-21 07:20:56 2008-11-21 BLOCKED HOME

5 iolve.pl arch 2008-02-06 07:20:57 2009-02-21 07:20:57 2008-11-21 BLOCKED HOME

6 wrzuts.pl arch 2008-02-06 07:20:59 2008-12-15 11:49:52 2009-02-21 07:20:59 2008-12-03 BLOCKED HOME

7 dobreprogray.pl arch 2008-02-06 07:21:00 2008-12-11 15:00:22 2009-02-21 07:21:00 2008-02-06 BLOCKED HOME

8 plemipna.pl arch 2008-02-06 07:21:00 2009-02-21 07:21:00 2008-11-21 BLOCKED HOME

9 donwload.pl arch 2008-02-06 07:21:01 2009-02-21 07:21:01 2008-06-26 BLOCKED HOME

10 namiotytargowe.pl arch 2008-02-06 07:21:05 2009-01-31 11:46:31 2009-02-21 07:21:05 2008-06-26 BLOCKED HOME

 

otrzymać taką:

ewsbank.pl

euroteltp.pl

wwwgrono.pl

iolve.pl

wrzuts.pl

dobreprogray.pl

plemipna.pl

donwload.pl

namiotytargowe.pl

 

A jak by do tego była opcja dodawania i odejmowania końcówek, to by było megafajne.

Edited by sylyx.com

Share this post


Link to post
Share on other sites

Sprawdz na PPD - z Twojego tekstu wychwyciło wszystkie domenki bez problemu ;)

 

"Wpisz dowolną treść, a system sam wyciągnie z niej domeny."

https://ppd.pl/check.html?for=book,registration,taste

 

Nizej masz jeszcze opcje "Dodawaj automatycznie końcówkę .pl do nazwy (przydatne np. w przypadku wyrazów słownikowych). " ;)

 

Pozdrawiam :)

Share this post


Link to post
Share on other sites
Problem w tym, że estibot też nie radzi sobie z IDN-ami. Chyba, że masz wersję premium i w niej jest inaczej?

 

Zobacz jak to działa u konkurencji. Generalnie chodzi o to żeby np. z takiej postaci:

 

 

otrzymać taką:

 

 

A jak by do tego była opcja dodawania i odejmowania końcówek, to by było megafajne.

Spróbuje to napisać. Do końca tygodnia powinno się pojawić.

Share this post


Link to post
Share on other sites
Sprawdz na PPD - z Twojego tekstu wychwyciło wszystkie domenki bez problemu :)

 

"Wpisz dowolną treść, a system sam wyciągnie z niej domeny."

https://ppd.pl/check.html?for=book,registration,taste

 

Nizej masz jeszcze opcje "Dodawaj automatycznie końcówkę .pl do nazwy (przydatne np. w przypadku wyrazów słownikowych). " :wacko:

 

Pozdrawiam :)

 

Zgadza się, wyciąga z dowolnego tekstu wszystkie domeny, nie-IDN i IDN, ze wszystkimi naskowymi końcówkami (.pl, funkcjonalne i regionalne).

Share this post


Link to post
Share on other sites
Nie działa. Zwraca tylko jedną domenę.

 

Możesz tu wkleić (albo na priv) tekst, który wrzucasz do czyszczenia? Mi działało poprawnie z tekstem, który podałeś wcześniej.

Share this post


Link to post
Share on other sites
"Disclaimer:

 

* nie gwarantuję poprawności działania

* używasz na własną odpowiedzialność"

 

Muszę dodać, że mimo, że nie gwarantuję poprawności funkcjonowania to się staram ^_^ Błąd, który zgłosił Sylyx powinien być już naprawiony.

Share this post


Link to post
Share on other sites

Ale przeciez napisanie czegos takiego to 2 linijki w php? Problem moze sie pojawic jesli jest jakies dziwne kodowanie, ale przy zalozeniu, ze ma byc polskie, mozna dopisac jeszcze 1 linijke z iconv i gotowe... Po co od razu jakis program?

Share this post


Link to post
Share on other sites
Ale przeciez napisanie czegos takiego to 2 linijki w php? Problem moze sie pojawic jesli jest jakies dziwne kodowanie, ale przy zalozeniu, ze ma byc polskie, mozna dopisac jeszcze 1 linijke z iconv i gotowe... Po co od razu jakis program?

 

Bardzo chętnie zobacze takie 2 linijki w PHP. Właściwie to niech będzie nawet 20. Jeśli się da to chyba zmienię ulubiony język z Pythona na PHP :wacko:

Share this post


Link to post
Share on other sites

W php napisałbym to mniej wiecej tak ze $post wchodzacy z formularza jest poddawany przez mniej wiecej cos takiego [a-zA-Z0-9_\-]+\.[a-zA-Z0-9_\-\.] itd przerabiany i wypluwany jako zwykly tekst i sadze ze na upartego moglbym sie zmiescic w 20linijkach chociaz nie jestem pewien :wacko:

Share this post


Link to post
Share on other sites

W pythonie bedzie to wygladalo dokladnie tak samo. Wystarczy jeden regexp. W przypadku stron w innym kodowaniu robi sie iconv na rodzime iso.

 

@Noname:

 

preg_match_all(...)

print_r(....)

 

2 linijki jak nic :wacko:

 

Co do samego regexpa dodac trzeba jeszcze polskie znaki i juz.

 

Edit:

 

W roli wyjasnienia jak wgywane sa dane:

 

preg_match_all(... file_get_contents($_GET['url']) ...);

Edited by FlashT

Share this post


Link to post
Share on other sites
brakuje skryptu do hurtowego sprawdzania czy domena ma założoną opcję :wacko:

 

To tez nie problem. Zalezy jak hurtowego. Ja mam wydajnosc 100 domen na minute. Bez EPP.

Share this post


Link to post
Share on other sites
W pythonie bedzie to wygladalo dokladnie tak samo. Wystarczy jeden regexp. W przypadku stron w innym kodowaniu robi sie iconv na rodzime iso.

 

Założeniem skryptu miała być obsługa IDN i zwracanie domen, a nie wszystkich ciągów znaków znaków mających kropkę. Jasne, że da się to zrobić za pomocą regexpa - tylko jak by on musiał wyglądać?

 

Zobacz jak działa mój skrypt. Dla danych wejściowych:

Россия.com
مصر.com
łódź.pl
pomyłkawTLD.kom
niepoprawna--domena.pl

 

zwraca

 

łódź.pl
россия.com
مصر.com

 

lub ewentualnie - po przełączeniu na punycode:

 

xn--d-uga0v4h.pl
xn--h1alffa9f.com
xn--wgbh1c.com

Share this post


Link to post
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now

×