본문 바로가기

구글 검색엔진에 관해 4.5 검색(Searching) 검색의 목표는 효율적으로 질 높은 검색 결과를 제공하는 것이다. 많은 대형 상업적 검색 엔진들은 효율성 측면에서는 큰 발전을 이뤄온 것처럼 보인다. 그러므로, 비록 우리 솔루션이 약간의 노력만 더 하면 상업적인 스케일로 확장가능하다고 믿고 있음에도 불구하고, 본 연구에서는 검색의 질적인 측면에 더 포커스를 맞춰왔다. 구글 질의어 평가 과정은 그림 4와 같다. 응답 시간에 제한을 두기 위해, 일단 일정 숫자(현재는 4만 개)의 관련 문서가 발견되면 서쳐는 자동으로 그림 4의 8단계로 건너 뛴다. 이것은 덜 최적화된(sub-optimal) 결과가 제공될 수도 있음을 의미한다. 우리는 현재 이 문제를 해결할 다른 방법을 찾고 있는 중이다. 과거에는, 히트를 페이지랭크(PageR.. 더보기
크롤링과 색인(Crawling and Indexing) 검색엔진은 일반적으로 사용자가 검색결과에서 콘텐츠를 사용할 수 있도록 하기 위해 크롤링 및 색인 생성이 라는 두 가지 주요 단계를 거칩니다. 크롤링은 검색엔진 크롤러가 공개 웹페이지에 액세스하는 순간을 말합니다. 여기에는 일반적으로 마치 사람이 하는 것처럼 웹페이지를 살펴보고 해당 페이지의 링크를 따라가는 것이 포함됩니다. 색인 생성에는 검색결과에 사용('게재')할 수 있도록 페이지에 대한 정보를 수집하는 것이 포함됩니다. 크롤링과 색인 생성의 차이는 중요합니다. 일반적으로 이 차이가 혼동되기 쉽지만 이로 인해 웹페이지가 검색결과에 표시되거나 표시되지 않을 수 있습니다. 페이지가 크롤링되지만 색인이 생성되지 않을 수 있으며 드물긴 하지만 크롤링되지 않았어도 색인이 생성될 수 있습니다. 또한 페이지 색인 .. 더보기
JSON이란? JSON(제이슨, JavaScript Object Notation)은, 인터넷에서 자료를 주고받을 때 그 자료를 표현하는 방법이다. 자료의 종류에 큰 제한은 없으며, 특히 컴퓨터 프로그램의 변수값을 표현하는 데 적합하다. 그 형식은 자바스크립트의 구문 형식을 따르지만, 프로그래밍 언어나 플랫폼에 독립적이므로 C, C++, C#, 자바, 자바스크립트, 펄, 파이썬 등 많은 언어에서 이용할 수 있다. 더보기