Интернет. Іздеу жүйелері. Интернеттегі іздеуді ұйымдастыру.

Жұмыстың мақсаты: Интернет желісіндегі іздеу жүйелерін тез пайдалануды үйрену.

Теориялық бөлімі.
Интернеттің негізгі түсініктері мен мүмкіндіктері. Интернеттің глобальды жүйесі 40-мыңнан аса әр түрлі локальды жүйелердің қосындысын құрайды. Әрбір локальды жүйе түйін немесе сайт деп , ал сайттың жұмысын қамтамасыз ететін заңды тұлға – провайдер. Сайт әдетте бірнеше компьютер – серверден тұрады. Олардың әрқайсысы ақпараттың анықталған түрін сақтауға арналған. Ақпаратты іздеу жүйесінің потенциалы (ИПС) (АІЖ) бүгінгі күнде жақсы дамыған. Қарапайым ортада кілттік сөз арқылы құжаттың арасынан ғана емес желілік адрес URL, серверлер атының арасынан, каталог және соңғы ақпараттық файлдар арасынан іздеуге мүмкіндік алуға болады. Сонымен қатар, URL өрісінде мұндағы латын әріптерін қолданатын, латын әріпімен сәйкес келмейтін тілдердің лексикасы жиі қолданылады. Бұл құбылыс россияның интернет секторы үшін толығымен сипатталған және масштабтың қатысуымен іздеу есептерін шешуде өте жоғарғы роль атқаратын арнайы желі атауларымен байланысқан.
Ішкімәтіндік және URL-іздеуі.

Белгілі болғандай, соңғы құжаттың (файлдың), URL-да орналасуы, оның URL- адрестік схемасымен бір мәнді беріледі. Егер құжат сервердердің түпкі каталогында орналаспаса, онда URL-де түйіннің аттары мен сол файлдың арасында тағы да сәйкес каталогтар аты пайда болады. www.literature.ru серверінде, proza каталогында, Tolstoy ішкі каталогында орналасқан, rasskazy.html гипотетикалық Web – парағы үшін пайда болады.
URL келесі түрде болады:
URL: http://www.literature.ru/proza/Tolstoy/rasskazy.html
Егер іздеу жүйесі жоғарыдағыдай көрсетілген құжатта тіркелсежәне адрестің элементі бойынша толық іздеуді жүргізуге болады, онда берілген параққа кез келген, яғни literature, proza, Tolstoy, rasskazy сөздері және олардың фрагменттері бойынша да шығуға болады.
Нақты ақпаратты іздеу жүйесі (АІЖ) іздеуінен тәуелді URL шеңберінде әртүрлі тәсілдермен немесе арнайы меню көмегімен және іздеу шаблоны терезесімен, мысалы: Рамблере мен Northern Light (1-ші суретті қара). Немесе командалар жолының режімінде, AltaVista немесе Yahoo (u:literature) ,Яндексе (url=»www.literature*») түрінде берілуі мүмкін. Кейбір іздеу машиналары, жеке жағдайда HotBot және Рамблер екеуі де альтернативті вариантты қолдайды.

1-ші сурет. URL бойынша (төменгі терезе) ізделінетін Northern Light www.northernlight.com), АІЖ-на іздеу сұраныстарының шаблондарының кеңейтілген формасының элементтері

2-ші сурет. Сұраныстағы мәтін өрісінің терминдері мен құрастырылатын URL-дан (төменгі) терминдерін енгізу үшін арнайы терезе мен Рамблердің (www.rambler.ru) кеңейтілген шаблонының элементтері.

Көптеген жүйелер құжаттың мәтініне (2-ші сурет) енетін, кілттік сөзі бар құрастырылған URL сұранысына мүмкіндік береді. Кеңейтілген AltaVista іздеуінде бұл мына түрде орындалуы мүмкін url:tolstoy AND «Еркіндік беруге талпыну » (сұраныстың екінші элементі әңгіменің аты болатын фразадан тұрады).

FTP файлдың архивымен жұмыс жасайтынг ескі желідегі АІЖ үшін, файлдар мен каталогтардың атауына кіретін кілттік сөздер бойынша іздеу әрқашан негізгі функция болып қалады. Нақты түрде іздеу адрес элементтерімен жүргізіледі, мұндағы Өрнектің пайда болуынан кейінгі көрініс URL схемасының адрестік стандартын уақытты мөлшерлеу арқылы жүргізеді. Сонымен индекстеудің әмбебаптығына жетті: ішкі бар файлдан тәуелсіз, оның АІЖ форматы ресурсты сәтті тіркеді. Бүгінге қарағанда негізгі мәнді жүктеуді тасымалдайтын адрес элементтері, сол уақытта өте үлкен ұқыптылықпен шыққаны белгілі. Желіде мәліметтер файлына еркін қатынасуды орналастыру үшін немесе 1.txt , gr12.exe атаулы программалар қоршаған ортаға қатысты жаман әсерде болады. Сондай-ақ ақпараттың көлемінің жинақталу шамасы бойынша келесі мәселелер мен кездесуге тура келді – оның адресіне енгізілген, кілттік сөздер жиыны көмегімен ресурсты релевантты сұранысқа шығу күннен күнге күрделірек болды. Сол кезде АІЖ жеке ресурсында айқындылығын жоғарлату керек болатындай, индекстелген жеке файлдарды қосымша мәтіндік түсініктемелермен жеткізуге мүмкіндік беретін шешім табылды.

Интернетке Дүние Жүзілік Өрнектің және мәтіндік ақпараттық маңызы бар Web – парағының келуі жағдайды өзгертті.

Еркін индекстеу үшін, Web құжаты форматының ашылуына байланысты, WWW іздеу машиналары тез дами бастады. Осы уақытта URL элементтері бойынша іздеу, Өрнектің көптеген іздеу жүйелерінен бастапқыда қолдау таппады. Сонымен қатар, ол бүгінгі күнде көптеген АІЖ-де қолданылады (Компьютер Пресс N 8 қара) және SESP стандарттық жобасында міндетті атрибут ретінде 1999 жылы іздеу жүйелері үшін тапсырылған. Қазіргі уақытта URL күшті болып барады. Ал кейбір жағдайларда іздеу есептерін шешудің өте сирек кездесетін құралы болып табылады. Бірақ-та оның қолданылуы бірнеше ерекшеліктерге байланысты.
Автор өңдеушінің тілегі адрестің ұзындығын керегінше қысқарту, бұдан қның ақпараттылығын сақтай отырып, файлдар мен каталогтардың атауының көлемді және адекватты ресурстардың атауы ретінде пайдалануын талап етеді. Сервердің бүкіл файлдық құрылымы жеке құжаттың мазмұнына қарағанда, қандай да бір шамада URL іздеуінің қолдану аймағы мен нәтижелілігін анықтайтын тұрақтылыққа ие болады.
Желіде Web парақтарын 20 есе пайдаланатын мәтіндегі games (ойын) ойын сөзін немесе сол атпен берілген каталогты табу керек. Егер сізді ойынның қазіргі версиясы қызықтыратын болса, онда каталогтың келешекте өте қажет болуы мүмкін. Сол сияқты, табылған unix.html файлы Unix операциялық жүйесінің оқулығы ретінде пайдаланудың мүмкіндігі зор. Ал денесінде кілттік сөздер бірнеше рет кездесетін кез келген атпен берілген құжаттардың мүмкіндігі аз.
Көптеген Web — мастерлерлі түйін аттарының жүйесін ыңғайлы түрде жасай отырып, келіп кетушілер үшін емес – бұдан атауларда түсініксіз цифрлар, қысқартулар және тағы басқа үшін береді. Осы қатысқа байланысты “ішкі қолдануға” арналған аттарды табу мәселесі ойдан ала салғандай. Бірақ-та, кейде ресурстар туралы бастапқы мәліметтер және мәліметтердің желідегі ресми түрде көріністерінің сипаттамалары атаулармен немесе осы жағдаймен нәтижелі жұмыс істеу үшін жеткілікті.
Адрестің элементтерін мүмкін болатын терминдерді іріктеп алу, оларды қысқарту және жазу варианттары жолымен таңдап алу іздеудің басқа тәсілдерімен сәтті бәсекелесуге әкеледі.
Тәжрибеде сервердің домендік атауы — URL ең тұрақты элементінің негізінде ресурстарды іздеу кеңінен қолданылады.

Тапсырма
Сервердің домендік атауы – URL ең тұрақты элементінің негізінде ресурстарды кең түрде іздеуді ұйымдастыру. Бағалы қағаздаро туралы ақпаратпен жұмыс істеу.
Кілттік сөздер бойынша ішкі мәтіндік іздеуді қолдана отырып ресурстарды кең түрде іздеуді ұйымдастыру. Экономикалық шолу мен финанстық жаңалықтармен жұмыс.
Электронды төлемдік жүйелердің ақпараттарымен жұмыс.
http://www/rbcnet.ru адресін енгіз. Web — парағының электронды коммерция орталығы жүктеледі.
Төлемдік жүйелерді қосу бойынша өтуді жүзеге асырыңыз.
Үш фирманың ақпараттарымен танысыңыз. Өзіңіздің бумаңыз жайында ақпаратты сақтаңыз.
Жасалынған жұмысқа есеп беруді безендіру. Оны мәтіндік редакторда есеп беру түрінде беезендіріңіз.

Бақылау сұрақтары:

1. Компьютер аралық байланыстың белгісі қандай?
2. “Клиент-сервер” технологиясын сипаттаңыз.
3. Компьютерлік желілерде интерфейстердің үйлесімсіздік мәселесін қалай жеңіп шығуға болады?
4. Коммуникация хаттамасы дегеніміз не?
5. Мәліметтер неге пакеттердің көмегімен беріледі?
6. Желілік топологияның негізгі түрлерін сипаттаңыз.
7. Архитектураның кең таралған желілерінің сипаттамасын атаңыз.
8. Арнайы желілік құралдарға қысқаша сипаттама беріңіз.
9. Локальды желілер қандай аймақтарда және қандай мақсатпен қолданылады?
10. Интернет желісінің негізгі сервистерін тізіп шығыңыз.