|
SURE: Shizuoka University REpository >
03. 情報学部 = Faculty of Informatics >
03. 学術雑誌論文(Journal Article) >
Please use this identifier to cite or link to this item:
http://hdl.handle.net/10297/4809
|
| Title: | 重み付き拡大アンカーテキストを用いたフォーカスドクローラーの開発 |
| Other Titles: | Focused Crawling Using Weighted Extended Anchor Texts |
| Authors: | 羽田, 哲也 大野, 成義 寺町, 康昌 石川, 博 |
| Journal Title: | 情報処理学会研究報告. データベース・システム研究会報告 |
| Publisher: | 情報処理学会 |
| Journal Volume: | 2007 |
| Journal Issue: | 65 |
| Start Page: | 491 |
| End Page: | 496 |
| Issue Date: | 2007-07-02 |
| Rights: | ここに掲載した著作物の利用に関する注意 本著作物の著作権は(社)情報処理学会に帰属します。本著作物は著作権者である情報処理学会の許可のもとに掲載するものです。ご利用に当たっては「著作権法」ならびに「情報処理学会倫理綱領」に従うことをお願いいたします。 Notice for the use of this material The copyright of this material is retained by the Information Processing Society of Japan (IPSJ). This material is published on this web site with the agreement of the author (s) and the IPSJ. Please be complied with Copyright Law of Japan and the Code of Ethics of the IPSJ if any users wish to reproduce, make derivative work, distribute or make available to the public any part or whole thereof. All Rights Reserved, Copyright (C) Information Processing Society of Japan. |
| NDC: | 007 |
| Abstract: | キーワードで指定できないような特定分野の情報を大量・網羅的に収集するような要求に汎用的な検索エンジンは応えられない。一方、人間はWeb上から必要な情報を探し出す際、アンカーテキストやその周辺の文字列などからリンク先のページに求めている情報があるかどうかを判断している。本研究では、人間のように拡大アンカーテキスト(アンカーテキスト及びその周辺文字列)を判断材料としてリンクを取捨選択し、特定分野のWebページのみを大量・高速に収集するクローラーの開発を目指す。また、精度の向上を図るために、拡大アンカーテキストに重みを付けることを検討する。 |
| ISSN: | 09196072  |
| Article NAID: | 110006381469  |
| Journal NCID: | AN10112482  |
| Textversion: | publisher |
| Appears in Collections: | 03. 学術雑誌論文(Journal Article)
|
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.
|