Back to Question Center
0

Семалт разрађује на УРЛитор-у - веома хладан веб скраћење и алатка за екстракцију података

1 answers:

УРЛитор је нови, али ефикасан алат за скраћење и уклањање података. Да бисте користили УРЛитор, једноставно морате додати листу свих УРЛ-ова чији садржај желите да стргате на интернету у предложеном шаблону. Затим морате одредити ХТМЛ елемент који желите да извучете са веб страница и кликните на дугме за слање. Тако је лако. Са овим алатом нећете више морати копирати или прилепити из претраживача - grain equipment company.

кПатх је језик који се користи за претраживање информација у КСМЛ датотекама. Користи одређене изразе за одабир чворова чворова или чворова у КСМЛ датотекама. Изрази које КСПатх разумеју су прилично слични онима који се користе са нормалним рачунарским датотекама или документима.

Иако се КСПатх користи са неколико програмских језика, овај алат је направљен за кориснике који немају познавање програма. Дакле, не морате бити програмер да га искористите. Помоћу овог алата можете извући податке са неколико ХТМЛ и КСМЛ страница.

За једноставност коришћења, неколико често коришћених КСПатх израза су унапред дефинисане у падајућем менију тако да корисници треба само да бирају било који од њих у зависности од њиховог циља. Међутим, искусни корисници КСПатх-а имају слободу да користе своје прилагођене изразе кад год пожеле..

Алат је дизајниран са капацитетом од 100 УРЛ-ова у једној скраћивој сесији, а траје највише 10 израза одједном. Другим ријечима, може поједноставити податке од максимално 100 УРЛ-ова истовремено.

Неки важни прилагођени изрази КСПатх који се могу модификовати или додати су прецизирани испод:

1. // див [2] - Овај израз бира други див хијерархијски;

2. // линк [@ рел = 'цаноницал'] / @ хреф - Овај израз одабире локацију (реф) ознаке која се користи за подесите атрибут рел једнак канонском;

3. / хтмл / хеад / мета [@ име = 'опис'] / @ садржај - Овај израз се користи за одабир садржаја;

4. // * [@ цласс = 'цласс-наме'] - Можете користити овај израз да изаберете све елементе са 'име класе' као ЦСС класа;

5. // х2 | // титле - Овај израз се може користити за одабир и првог Х2 и наслова странице;

6. // * [име

= 'х1' или име

= 'наслов'] - Овај израз делује тачно као претходно. Међутим, горе приказани израз је бољи јер је краћи;

7. // * [садржи (@цласс, 'тхумб')] - Овај израз бира сваки елемент који има ЦСС класу и садржи 'палац' за екстракцију;

8. // родитељ :: * [тект

= 'Добродошли'] - Овај израз бира родитељ било ког елемента који има текст 'Добродошли ';

Овај алат је Бета верзија и још увек може радити са неким грешкама. Међутим, и даље је одлично средство за кориснике са малим или никаквим програмским знањем, пошто су сви често коришћени изрази унапред дефинисани у менију као што је раније поменуто.

December 7, 2017