컴퓨터 Tip

더 좋은 구글 검색 방법

achivenKakao 2007. 2. 28. 18:59

JOINC에서 퍼왔습니다

-----------------------------------------------------------------------------------------

이 문서는 구글 검색엔진을 이용해서 문서를 더 잘 찾을 수 있는 기술들에 대한 내용을 담고 있다. 구글은 상당히 복잡한 검색옵션을 제공하는데, 여기에서는 그 중에서 간단하면서도 효율적인 몇 가지 방법에 대해서 소개할 것이다.

쌍 따움표

2개 이상의 쿼리 문장이 주어졌을 경우, 구글은 각 쿼리어간의 거리를 검사해서 score를 계산한다. socket api를 검색어로 입력했다면, socket와 api가 동시에 발견된 문서 중에서, 가능한 가까이 붙어있는 문서가 우선 노출되는 방식이다. 그러나 노래가사와 같은 경우에는 거리에 상관없이 반드시 붙어있어야 할 것이다.

예를 들어 harry potter를 검색할 경우, "harry potter"로 검색하는게 원하는 결과를 얻을 확률이 높다.

harry potter를 검색어로 입력할 경우에는 harry potter, harry ant potter, Im potter. your harry?'등등이 검색될 수 있는데, 쌍따움표로 묶어줄 경우 harry 다음에 potter이 포함된 문서만 검색하기 때문이다.

키워드의 포함과 제외

Wireless Networking로 검색을 한다고 가정해 보자. 우리가 원하는 정보는 무선 네트워크 기술이다.

이경우 Wireless와 Networking가 모두 포함된 문서가 상위에 검색될 확률이 높지만, 문서자체의 가중치에 의해서 Wireless와 Networking 둘중 하나만 포함된 문서가 상위에 검색될 수도 있다. 그렇다면 가장 확실한 검색방법은 따움표로 묶는 방법이 될 것이다.
"Wireless Networking"

그러나 이 경우에는 검색되는 문서의 양이 너무 적어져서, 중요한 문서가 빠질 수도 있다. 그렇다면 쌍따움표를 빼고 검색어를 만드는 방법이 있다.
Wireless NetWorking

이 경우에는 다양한 문서가 검색되겠지만, Wireless와 NetWorking 둘중 하나만 포함되어도 검색결과에 노출되므로, 쓸데 없는 문서까지 검색될 수 있다. 이를테면 Wireless phone, Wireless PDA등이 무선 네트워크 장비 관련 정보들 까지 떠버린다. 우리가 중요한건 네트워크 기술이므로, Networking를 반드시 포함시키도록 하면, 좀더 좋은 결과를 얻을 수 있을 것이다. 이렇게 해당 검색어를 반드시 포함시키고자 할때에 +를 검색어 앞에 붙여주면 된다.
Wireless +NetWorking

키워드를 제외할 필요도 있을 것이다. 이경우에는 -를 사용하면 된다.
"Wireless NetWorking" -wired +routers

필드 명령

검색엔진들은 필드검색이 가능하도록 색인테이블을 지원한다. 즉 site, contents (본문), link, title 별로 검색이 가능하도록 색인테이블을 작성한다. 이를 이용하면 특정 site내에서의 검색이라든지, 사이트의 제목에서만 검색하는 등의 검색작업을 수행할 수 있다. 다음은 www.joinc.co.kr 사이트내에서 "socket api"문장을 포함한 문서를 찾는다.
site:www.joinc.co.kr.co "socket api"

또한 상위 도메인명을 필드로 지정할 수도 있다. 아래와 같이 하면 .co.kr도메인을 가진 문서에 대해서 검색을 수행하게 된다.
site:.co.kr "socket api"

intitle:를 이용하면 문서의 제목만을 가지고 검색을 한다. title에 joinc가 포함된 문서 중에서 wiki가 검색된 문서를 찾는다.
intitle:joinc wiki

:: Search Titles, URLs and Filetypes ::
Google has the ability to search webpages' titles and urls. You can search for a keyword in the url or title, for example:
QUOTE
inurl:google.com

will search for all the pages google has indexed on google.com, its just like the site: command except not as accurate in my opinion. One feature that can be said for the inurl command though is that it can search for filenames as well, e.g. 'inurl:hotmail.com/INDEX.HTML' where as the 'site:' command cannot, it can only search the url from: www. to .com/.org/.net/etc...
Now about searching titles...
the 'intitle:' is extremely handy, you can search for webpages on anything like this:
QUOTE
intitle:"Harry Potter Fans!"

will search for a harry potter fan site, you can also find empty directories issuing this command:
CODE
intitle:"Index of /"

because "Index of" is the default text shown on a directory with no index page and no htaccess code protecting it it will search all of its indexed pages for empty directories.
Now onto the Filetypes, Google can also search specific filetypes, say c source code if you wanted to. The basic command is
CODE
filetype:

you can use this in conjunction with the site command to find some neat stuff, it can also be used maliciously you'll know what i mean after this.
CODE
site:microsoft.com filetype:asp inurl:"admin/login"

that will tell Google to look for the indexed pages of microsoft.com that are ASP pages and the url contains "admin/login" so basically it is looking for something like "microsoft.com/restricted/admin/login.asp" or something like that, you can now see why it is a security flaw, it can find pages you cant.

:: Other Info ::
Now Google can be stopped from peeking its nosy little robots into your site by creating a ROBOTS file, it basically tells automatic spider robots (automated programs sent from search engines like Google to index your pages and give the search engine a list of pages). Now im not going to go into the subject in this tutorial because this is on Google. But i have just done a quick search on Google and found:
CODE
http://www.outfront.net/tutorials_02/adv_tech/robots.htm

which is a tutorial on the subject.
Now you may be curious to see what robot files look like, well lets use what i've shown you today,
CODE
inurl:"robots.txt" filetype:txt

Will search for all pages that has 'robots.txt' in the URL of the site and the filetype is a txt file.
Just to let you know that all of the explained above togetther can create a very powerful search query and allow a user to find almost anything on Google and virtually the Internet because Google has Billions of pages indexed on more subjects you could ever think of.

This has not been a complete search guide to Google but should get you started.
You can find more info on advance google searching at: http://www.google.co.uk/help/operators.html
or i can save you alot of time instead of reading all this and just go to Googles Advance Search form page dry.gif dry.gif dry.gif http://www.google.com/advanced_search

 

       - 출처 루오니 홈페이지