วันจันทร์ที่ 17 มกราคม พ.ศ. 2554

ความรู้เกี่ยวกับ search engine


ความรู้เกี่ยวกับ search engine
        ในโลกไซเบอร์สเปซมีข้อมูลมากมายมหาศาล การที่จะค้นหาข้อมูลจำนวนมากมายอย่างนี้เราไม่อาจจะคลิกเพื่อค้นหาข้อมูลพบได้ง่ายๆ จำเป็นจะต้องอาศัยการค้นหาข้อมูลด้วยเครื่องมือค้นหาที่เรียกว่า Search Engine เข้ามาช่วยเพื่อความสะดวกและรวดเร็ว เว็บไซต์ที่ให้บริการค้นหาข้อมูลมีมากมายหลายที่ทั้งของคนไทยและต่างประเทศ
    ความหมาย/ประเภทของ Search Engine การค้นหาข้อมูลบนเครือข่ายอินเทอร์เน็ตที่มีอยู่เบ็นจำนวนมาก ถ้าเราเปิดไปทีละหน้าจออาจจะต้องเสียเวลาในการค้นหา และอาจหาข้อมูลที่เราต้องการไม่พบ การที่เราจะค้นหาข้อมูลให้พบอย่างรวดเร็วจะต้องใช้เว็บไซต์สำหรับการค้นหาข้อมูลที่เรียกว่า Seaech Engine Site ซึ่งจะทำหน้าที่รวบรวมรายชื่อเว็บไซต์ต่างๆ เอาไว้ โดยจัดแยกเป็นหมวดหมู่ ผู้ใช้งานเพียงแต่ทราบหัวข้อที่ต้องการค้นหาแล้วป้อน คำหรือข้อความของหัวข้อนั้นๆ ลงไปในช่องที่กำหนด คลิกปุ่มค้นหา (หรือกดปุ่ม Enter) เท่านั้น รอสักครู่ข้อมูลอย่างย่อๆ และรายชื่อเว็บไซต์ที่เกี่ยวข้องจะปรากฏให้เราเข้าไปศึกษาเพิ่มเติมได้ทัน
Search Engine แต่ละแห่งมีวิธีการและการจัดเก็บฐานข้อมูลที่แตกต่างกันไปตามประเภทของSearch Engine ที่แต่ละเว็บไซต์นำมาใช้เก็บรวบรวมข้อมูล ดังนั้นการที่คุณจะเข้าไปหาข้อมูลหรือเว็บไซต์ โดยวิธีการ Search นั้น อย่างน้อยคุณจะต้องทราบว่า เว็บไซต์ที่คุณเข้าไปใช้บริการ ใช้วิธีการหรือ ประเภทของ Search Engine อะไร เนื่องจากแต่ละประเภทมีความละเอียดในการจัดเก็บข้อมูลต่างกันไป ที่นี้เราลองมาดูซิว่า Search Engine ประเภทใดที่เหมาะกับการค้นหาข้อมูลของคุณ
ประเภทของsearch engine
  1. Keyword Index   เป็นการค้นหาข้อมูล โดยการค้นจากข้อความในเว็บเพจที่ได้ผ่านการสำรวจมาแล้ว จะอ่านข้อความ ข้อมูล อย่างน้อยๆ ก็ประมาณ 200-300 ตัวอักษรแรกของเว็บเพจนั้นๆ โดยการอ่านนี้จะหมายรวมไปถึงอ่านข้อความที่อยู่ในโครงสร้างภาษา HTML ซึ่งอยู่ในรูปแบบของข้อความที่อยู่ในคำสั่ง alt ซึ่งเป็นคำสั่งภายใน TAG คำสังของรูปภาพ แต่จะไม่นำคำสั่งของ TAG อื่นๆ ในภาษา HTML และคำสั่งในภาษา JAVA มาใช้ในการค้นหา วิธีการค้นหาของ Search Engine ประเภทนี้จะให้ความสำคัญกับการเรียงลำดับข้อมูลก่อน-หลัง และความถี่ในการนำเสนอข้อมูลนั้น การค้นหาข้อมูล โดยวิธีการเช่นนี้จะมีความรวดเร็วมาก แต่มีความละเอียดในการจัดแยกหมวดหมู่ของข้อมูลค่อนข้างน้อย เนื่องจากไม่ได้คำนึงถึงรายละเอียดของเนื้อหาเท่าที่ควร แต่หากว่าคุณต้องการแนวทางด้านกว้างของข้อมูล และความรวดเร็วในการค้นหา วิธีการนี้ก็ใช้ได้ผลดี
     
  2. Subject Directories   การจำแนกหมวดหมู่ข้อมูล Search Engine ประเภทนี้ จะจัดแบ่งโดยการวิเคราะห์เนื้อหา รายละเอียด ของแต่ละเว็บเพจ ว่ามีเนื้อหาเกี่ยวกับอะไร โดยการจัดแบ่งแบบนี้จะใช้แรงงานคนในการพิจารณาเว็บเพจ ซึ่งทำให้การจัดหมวดหมู่ขึ้นอยู่กับวิจารณญาณของคนจัดหมวดหมู่แต่ละคนว่าจะจัดเก็บข้อมูลนั้นๆ อยู่ในเครือข่ายข้อมูลอะไร ดังนั้นฐานข้อมูลของ Search Engine ประเภทนี้จะถูกจัดแบ่งตามเนื้อหาก่อน แล้วจึงนำมาเป็นฐานข้อมูลในการค้นหาต่อไป การค้นหาค่อนข้างจะตรงกับความต้องการของผู้ใช้ และมีความถูกต้องในการค้นหาสูง เป็นต้นว่า หากเราต้องการหาข้อมูลเกี่ยวกับเว็บไซต์ หรือเว็บเพจที่นำเสนอข้อมูลเกี่ยวกับคอมพิวเตอร์ Search Engine ก็จะประมวลผลรายชื่อเว็บไซต์ หรือเว็บเพจที่เกี่ยวกับคอมพิวเตอร์ล้วนๆ มาให้คุณ
     
  3. Metasearch Engines   จุดเด่นของการค้นหาด้วยวิธีการนี้ คือ สามารถเชื่อมโยงไปยัง Search Engine ประเภทอื่นๆ และยังมีความหลากหลายของข้อมูล แต่การค้นหาด้วยวิธีนี้มีจุดด้อย คือ วิธีการนี้จะไม่ให้ความสำคัญกับขนาดเล็กใหญ่ของตัวอักษร และมักจะผ่านเลยคำประเภท Natural Language (ภาษาพูด) ดังนั้น หากคุณจะใช้ Search Engine แบบนี้ละก็ ขอให้ตระหนักถึงข้อบกพร่องเหล่านี้ด้วย
     
      ดังนั้น การเลือกใช้เครื่องมือในการค้นหาจะต้องเข้าใจว่า ข้อมูลที่ต้องการค้นหานั้นมีลักษณะอย่างไร มีขอบข่ายกว้างขวางหรือแคบขนาดไหน แล้วจึงเลือกใช้เว็บไซต์ค้นหาที่ให้บริการตรงกับความต้องการของเรา
วิธีการค้นหาข้อมูลโดยใช้ Search Engine


การค้นหาข้อมูลมีกี่วิธี ?   มี 2 วิธีครับ
1. การค้นหาในรูปแบบ Index Directoryวิธีการค้นหาข้อมูลแบบ Index นี้ข้อมูลจะมีความเป็นระเบียบเรียบร้อยมากกว่าการค้นหาข้อมูลด้วย วิธี Search Engine โดยมันจะถูกคัดแยกข้อมูลออกมาเป็นหมวดหมู่ และจัดแบ่งแยก Site ต่างๆออก เป็นประเภท สำหรับวิธีใช้งาน คุณสามารถที่จะ Click เลือกข้อมูลที่ต้องการจะดูได้เลยใน Web Browser จากนั้นที่หน้าจอก็จะแสดงรายละเอียดของหัวข้อปลีกย่อยลึกลงมาอีกระดับหนึ่ง ปรากฏขึ้นมาให้เราเลือกอีก ส่วนจะแสดงออกมาให้เลือกเยอะแค่ไหนอันนี้ก็ขึ้นอยู่กับขนาดของฐานข้อมูลในIndex ว่าในแต่ละประเภท จัดรวบรวมเก็บเอาไว้มากน้อยเพียงใด เมื่อคุณเข้าไปถึงประเภทย่อยที่คุณสนใจแล้ว ที่เว็บเพจจะแสดงรายชื่อของเอกสารที่เกี่ยวข้องกับ ประเภทของข้อมูลนั้นๆออกมา หากคุณคิดว่าเอกสารใดสนใจหรือต้องการอยากที่จะดู สามารถ Click ลงไปยัง Link เพื่อขอเชื่อต่อทางไซต์ก็จะนำเอาผลของข้อมูลดังกล่าวออกมาแสดงผลทันที นอกเหนือไปจากนี้ ไซต์ที่แสดงออกมานั้นทางผู้ให้บริการยังได้เรียบเรียงโดยนำเอา Site ที่มีความเกี่ยว ข้องมากที่สุดเอามาไว้ตอนบนสุดของรายชื่อที่แสดง

2. การค้นหาในรูปแบบ Search Engine
          วิธีการอีกอย่างที่นิยมใช้การค้นหาข้อมูลคือการใช้ Search Engine ซึ่งผู้ใช้ส่วนใหญ่กว่า 70% จะใช้วิธีการค้นหาแบบนี้ หลักการทำงานของ Search Engine จะแตกต่างจากการใช้ Index ลักษณะของมันจะเป็นฐานข้อมูลขนาดใหญ่มหาศาลที่กระจัดกระจายอยู่ทั่วไปบน Internet ไม่มีการแสดงข้อมูลออกมาเป็นลำดับขั้นของความสำคัญ การใช้งานจะเหมือนการสืบค้นฐานข้อมูล อื่นๆคือ คุณจะต้องพิมพ์คำสำคัญ (Keyword) ซึ่งเป็นการอธิบายถึงข้อมูลที่คุณต้องการจะเข้าไป ค้นหานั้นๆเข้าไปจากนั้น Search Engine ก็จะแสดงข้อมูลและ Site ต่างๆที่เกี่ยวข้องออกมา
หลักการค้นหาข้อมูลของ Search Enine
สำหรับหลักในการค้นหาข้อมูลของ Search Engine แต่ละตัวจะมีลักษณะที่แตกต่างกันออกไป ขึ้นอยู่กับว่าทางศูนย์บริการต้องการจะเก็บข้อมูลแบบไหน แต่โดยส่วนใหญ่แล้วจะมีกลไกใน การค้นหาที่ใกล้เคียงกัน หากจะแตกต่างก็คงจะเป็นเรื่องประสิทธิภาพเสียมากกว่า ว่าจะมีข้อมูล เก็บรวบรวมไว้อยู่ในฐานข้อมูลมากน้อยขนาดไหน และพอจะนำเอาออกมาบริการให้กับผู้ใช้ ได้ตรงตามความต้องการหรือเปล่า ซึ่งลักษณะของปัจจัยที่ใช้ค้นหาโดยหลักๆจะมีดังนี้

      1. การค้นหาจากชื่อของตำแหน่ง URL ใน เว็บไซต์ต่างๆ

      2. การค้นหาจากคำที่มีอยู่ใน Title (ส่วนที่ Browser ใช้แสดงชื่อของเว็บเพจอยู่ทางด้าน ซ้ายบนของหน้าต่างที่แสดง

      3. การค้นหาจากคำสำคัญหรือคำสั่ง keyword (อยู่ใน tag คำสั่งใน html ที่มีชื่อว่า meta)

      4. การค้นหาจากส่วนที่ใช้อธิบายหรือบอกลักษณะ site

การค้นหาข้อมูลด้วย Search Engine

      1. เปิดเว็บไซด์ที่ให้บริการ
      2. ใส่คำ (keyword) ที่คุณต้องการจะค้นหาลงไปในช่องยาวๆ (text box) ที่มีสร้างเอาไว้ให้
      3. คลิ๊กที่ปุ่ม ค้นหา (กรณีเลือก Search Engine ที่อื่นอาจจะไม่ได้ใช้คำนี้ก็ได้ แล้วแต่ที่คุณเลือก



           โปรแกรมจะเริ่มค้นหาคำนั้นๆให้ ตอนนี้คุณก็รอสักพักนึงก่อน จากนั้นรายชื่อของเว็บเพจต่างๆ ที่เกี่ยวข้องกับข้อมูลที่ระบุจะถูกแสดงออกมาในรูปแบบของลิ้งค์พร้อมคำอธิบายประกอบนิดหน่อย ให้เราอ่านเพื่อใช้ในการตัดสินใจว่ามันเกี่ยวข้องกับข้อมูลที่เราต้องการหรือเปล่า ส่วนใหญ่ข้อมูลที่พบมีมากจนเกินกว่าที่จะแสดงให้เห็นหมดในหน้าเดียว มันจะมีตัวแบ่งหน้าให้เราทางด้าน ล่างสำหรับเลือกไปดูรายละเอียดส่วนอื่นๆที่เหลือในหน้าถัดๆไป แต่โดยมากแล้วข้อมูลที่ใกล้เคียง กับคำที่เราต้องการมากที่สุดจะอยู่ในช่วงต้นๆ ของรายการแรกที่ SearchEngine นั้นๆตรวจพบ
         นอกจากการค้นหาข้อมูลแล้ว Search Engine บางที่ ยังสามารถค้นหา รูปภาพ ได้อีกด้วยครับการค้นหาด้วยวิธี Search Engine นั้นมักจะได้ผลลัพธ์ออกมากว้างๆชี้เฉพาะเจาะจงได้ยาก บางครั้งข้อมูลที่ ค้นหามาได้อาจมีถึงเป็นร้อยเป็นพัน Site แล้วมีใครบ้างหละที่อยากจะมานั้งค้นหาและอ่านดูที่จะเพจ ซึ่งคง ต้องเสียเวลาเป็นวันๆแน่ซึ่งก็ไม่รับรองด้วยว่าคุณจะได้ข้อมูลที่คุณต้องการหรือไม่ ดังนั้นจิงมีหลักในการค้น หา เพื่อให้ได้ข้อมูลใกล้เคียงความเป็นจริงมากที่สุด

ค้นหาคำในหน้าเว็บเพจด้วย Browser
         การค้นหาคำในหน้าเว็บเพจนั้นจะใช้สำหรับกรณีที่คุณเข้าไปค้นหาข้อมูลที่เว็บเพจใด เว็บเพจหนึ่ง แล้วภายในมีข้อความปรากฏอยู่เต็มไปหมด จะนั่งไล่ดูทีละบรรทัดคงไม่สะดวก ในลักษณะนี้เราใช้ใช้ browser ช่วยค้นหาให้ คือ

      1. ขึ้นแรกให้คุณนำ mouse ไป click ที่ menu Edit
      2. แล้วเลือกบรรทัดคำสั่ง Find (on  This Page) หรือกดปุ่ม Ctrl + F ที่ keyboard ก็ได้
      3. จากนั้นใส่คำที่ต้องการค้นหาลงไปแล้วก็กดปุ่ม Find Next
          โปรแกรมก็จะวิ่งหาคำดังกล่าว หากพบมันก็จะกระโดดไปแสดงคำนั้นๆ
          ซึ่งคุณสามารถกดปุ่ม Find Next เพื่อค้นหาต่อได้ อีกจนกว่าคุณจะพบข้อมูลที่ต้องการ

ข้อแตกต่างระหว่าง Index และ Search Engine
          คำตอบก็ คือวิธีในการค้นหาข้อมูลแบบ Index เค้าจะใช้คนเป็นผู้จัดรวบรวมและทำระบบฐานข้อมูลขึ้นมา
ส่วนแบบ Search Engine นั้นระบบฐานข้อมูลของมันจะได้รับการจัดสร้างโดยใช้ Software ที่มีหน้าที่เกี่ยวกับงานทางด้านนี้โดยเฉพาะมาเป็นตัวควบคุมและจัดการ ซึ่งเจ้า Software ตัวนี้จะมี ชื่อเรียกว่า Spiders การทำงานข้องมันจะใช้วิธีการเดินลัดเลาะไปตามเครือข่ายต่างๆที่เชื่อมโยงถึงกันอยู่เต็มไปหมดใน Internet เพื่อค้นหา Website ที่เกิดขึ้นมาใหม่ๆ รวมทั้งยังสามารถตรวจสอบหาความเปลี่ยนแปลงของ ข้อมูลใน Site เดิมที่มีอยู่ ว่าที่ใดถูกอัพเดตแล้วบ้าง จากนั้นมันก็จะนำเอาข้อมูลทั้งหมดที่สำรวจเข้ามา ได้เก็บใส่เข้าไปในฐานข้อมูลของตนอัตโนมัติ ยกตัวอย่างของผู้ให้บริการประเภทนี้เช่น Excite , googleเป็นต้น
ประเภทของsearch engine
ประเภทที่ 1 Crawler Based Search Engines

 คือ เครื่องมือการค้นหาบนอินเตอร์เน็ตแบบอาศัยการบันทึกข้อมูล และ จัดเก็บข้อมูลเป็นหลัก ซึ่งจะเป็นจำพวก Search Engine ที่ได้รับความนิยมสูงสุด เนื่องจากให้ผลการค้นหาแม่นยำที่สุด และการประมวลผลการค้นหาสามารถทำได้อย่างรวดเร็ว จึงทำให้มีบทบาทในการค้นหาข้อมูลมากที่สุดในปัจจุบัน โดยมีองค์ประกอบหลักเพียง 2 ส่วนด้วยกันคือ
          1. ฐานข้อมูล โดยส่วนใหญ่แล้ว Crawler Based Search Engine เหล่านี้จะมีฐานข้อมูลเป็นของตัวเอง ที่มีระบบการประมวลผล และ การจัดอันดับที่เฉพาะ เป็นเอกลักษณ์ของตนเองอย่างมาก
          2. ซอฟแวร์ คือ เครื่องมือหลักสำคัญที่สุดอีกส่วนหนึ่งสำหรับ Serch Engine ประเภทนี้ เนื่องจากต้องอาศัยโปรแกรมเล็กๆ ทำหน้าที่ในการตรวจหา และทำการจัดเก็บข้อมูล หน้าเพจ หรือ เว็บไซต์ต่าง ๆ ในรูปแบบของการทำสำเนาข้อมูล เหมือนกับต้นฉบับทุกอย่าง ซึ่งเราจะรู้จักกันในนาม  Spider หรือ Web Crawler หรือ Search Engine Robots เช่น
www.google.com



ประเภทที่ 2 Web Directory หรือ Blog Directory
        คือ สารบัญเว็บไซต์ที่ให้สามารถค้นหาข่าวสารข้อมูล ด้วยหมวดหมู่ข่าวสารข้อมูลที่เกี่ยวข้องกัน ในปริมาณมากๆ คล้าย ๆ กับสมุดหน้าเหลือง ซึ่งจะมีการสร้าง ดรรชนี มีการระบุหมวดหมู่อย่างชัดเจน ซึ่งจะช่วยให้การค้นหาข้อมูลต่าง ๆ ตามหมวดหมู่นั้น ๆ ได้รับการเปรียบเทียบอ้างอิง เพื่อหาข้อเท็จจริงได้ในขณะที่เราค้นหาข้อมูล เพราะว่าจะมีเว็บไซต์มากมาย หรือ Blog มากมายที่มีเนื้อหาคล้าย ๆ กันในหมวดหมู่เดียวกัน ให้เราเลือกที่จะหาข้อมูลได้อย่างตรงประเด็นที่สุด (ลดระยะเวลาได้มากในการค้นหา) ตัวอย่างเช่น

    1. ODP หรือ Dmoz ที่หลาย ๆ คนรู้จัก ซึ่งเป็น Web Directory ที่ใหญ่ที่สุดในโลก Search Engine หลาย ๆ แห่งก็ใช้ข้อมูลจากที่แห่งนี้เกือบทั้งสิ้น เช่น Google, AOL, Yahoo, Netscape และอื่น ๆ อีกมากมาย ODP มีการบันทึกข้อมูลประมาณ 80 ภาษาทั่วโลก รวมถึงภาษาไทยด้วย (URL : http://www.dmoz.org )
     2. สารบัญเว็บไทย SANOOK ก็เป็น Web Directory ที่มีชื่อเสียงอีกเช่นกัน และเป็นที่รู้จักมากที่สุดในเมืองไทย(URL : http://webindex.sanook.com )



ประเภทที่ 3 Meta Search Engine
        คือ Search Engine ที่ใช้หลักการในการค้นหาโดยอาศัย Meta Tag ในภาษาHTML ซึ่งมีการประกาศชุดคำสั่งต่าง ๆ เป็นรูปแบบของ Tex Editor ด้วยภาษา HTML นั่นเองเช่น ชื่อผู้พัฒนา คำค้นหา เจ้าของเว็บ หรือ บล็อก คำอธิบายเว็บหรือบล็อกอย่างย่อ ผลการค้นหาของ Meta Search Engine นี้มักไม่แม่นยำอย่างที่คิด เนื่องจากบางครั้งผู้ให้บริการหรือ ผู้ออกแบบเว็บสามารถใส่อะไรเข้าไปก็ได้มากมายเพื่อให้เกิดการค้นหาและพบเว็บ หรือ บล็อกของตนเองและอีกประการหนึ่งก็คือ มีการอาศัย Search Engine Index Server หลาย ๆ แห่งมาประมวลผลรวมกัน จึงทำให้ผลการค้นหาข้อมูลต่าง ๆ ไม่เที่ยงตรงเท่าที่ควร

ไม่มีความคิดเห็น:

แสดงความคิดเห็น