1. 구글 검색의 작동 원리

웹콘텐츠 구성

크롤링

새로 크롤링,
기존 페이지 추가 및 링크 깨짐등 확인

(색인생성)
페이지 콘텐츠 렌더링
키워드 및 정보들 기록

수십억 개의 웹페이지 1억 GB이상

색인은 단순히 키워드, 검색어 그 이상이다
그래프기반, 웹페이지 정보 + 다른유형의 정보 체계화

검색 알고리즘

- 랭킹시스템의역할
유용한 정보
관련성높은정보
신속한정보제공

- 랭킹시스템 알고리즘

관련성 유용성

출처 전문성

사용자 위치 및 설정 등등

ex) 오늘의 주식 -> 오늘+주식 단어의 뜻보다 오늘의주식정보를 보는것이 더 유용한 정보이다

검색품질 평가 가이드라인이 있음

검색 알고리즘 주요요소
- 검색어 이해

검색어 의미(intent)

를 이해해야함

전구를 바꾸는 방법 - 교체하다
우체국은 외환을 바꿔줄까요 - 교환하다
노트북의 밝기를 바꾸는 방법 - 조절하다

- 검색어의 범위
- 구체적? 광범위? ...

- 웹페이지 관련성
검색어(키워드) 포함여부
검색어 등장 위치
검색어와 웹페이지의 언어가 같은지
신호들

검색어 등장 여부 그 이상
'강아지'검색
'강아지'단어가 포함된 웹페이지들
'강아지'사진들

- 콘텐츠의 품질

가장 유용한 페이지가 먼저 표시될 수 있도록
어떤 웹페이지들이

- 더 전문성있는지
등등등..

- 스팸

미흡한 사용자 환경제공
구글 사용자에게 피해주거나 현혹 (특정키워드 반복등)

- 웹페이지 접근성
다양한 브라우저, 다양한 기종에서 접근이 용이한지

검색 알고에 중요하고 실행가능한 번경사항을 사이트 소유자들에게 미리 알리기위해 노력
- 6개월 전에 알고리즘을 미리 알려줌

맥락
사용자의 위치, 이전검색 기록 활용

- 사용자의 기본언어설정, 세이프서치설정, 검색설정 활용

- 사용자의 검색 활동 정보 활용

예. 바르셀로나 vs 아스널 검색한다음 바르셀로나를 검색하면 - 도시가아닌 축구팀의 정보를 원하는 단서로 봄

유용한 검색 결과란?

사용자가 뜻하는 말을 정확히 이해하고
사용자가 원하는것을 정확이 제공할 수 있어야 완벽한 검색엔진이다

새로운 사용자가 계속 생겨남에 따라 진화중
2018년 한해동안만 3234여 개의 개선사항 적용

아이디어 -> 실험 -> 출시

실험

- 검색평가자 품질 테스트 (가이드라인 사용)

- 비교 실험 (AB 테스팅과 비슷)
- 실시간 트래픽 실험
- 출시

2. 구글 검색기능 활용하기

구조화된 데이터

구글이 페이지 내용을 이해하고
특별한 기능으로 작동하도록 도와주는 웹 표준 형식 ( 각 회사에서 구글에게 메타데이터에 맞춰서 정보를 제공하는등)

양식에 맞춰 태그를 붙히는 등으로 형식을 맞춘다. 양식에 잘맞춰줬는지 분석하고 적격 부적격 판별도 지원

- 레시피 마크업

- 케로셀

- 동영상 key 모먼트 (타임스탬프, 썸네일, 설명 노출)

마크업을 적용하면 콘텐츠가 노출될수 있는 조건이 갖춰진것이고
바로 보여지는 것은 아니다.

구글 검색 개발자 가이드에 자세히 설명되어있다.
검색 갤러리에서 사이트에 가장 적절한 구조화된 데이터 찾고,
마크업 예시를 보고 마크업을 적용

rich results test 도구를 통해 마크업상태를 확인하고 서치콘솔을 통해 페이지 퍼포먼스를 측정하고 오류진단

지식패널 - 구글에서 해당 키워드에 대한 정보를 분석하고, 저장해놓음
수정요청, 소유권 주장등이 가능

구글 마이비즈니스 -
구글맵에 가게 노출, 고객 평가등 가능

3. 검색엔진이 이해하는 웹 사이트 만들기

메타태그에 name='robots' 를 사용하여 검색엔진이 접근할수 있도록 함
한때 검색엔진 접근 허용이 보안적으로 열러있다고 생각되는때가 있었다
robots.txt는 무슨용도일까?

검색엔진의 트래픽을 조절하는 용도

검색엔진 = 사용자
사이트 구현부분에 대한 것을 막지 않기?
disallow: /css/
disallow: /js/ 등등

올바른 활용
불필요한 트래픽을 일으키는 부분 차단하기

disalow: /ad
disallow: /search

검색엔진이 여러분의 페이지를 발견할 수 있나요?

링크는 검색엔진이 웹에서 페이지를 발견하는 일반적인 경로는 링크
대부분 검색엔진이 자바스크립트의 링크를 따라가지않기때문에 <a> tag와 함께 herf 속성을 함께 사용
모든페이지를 링크로 연결하기
<a href="/link"> 크롤됨 </a>
<onclick=getPage("link")> 크롤 안됨

Sitemap

사이트에 있는 페이지, 동영상 및 파일에 대해 검색엔진에 알려주는 도구

만약 사이트가 아래와같은경우 제출하는것이 좋음
- 규모가 큰 사이트
- ~~~

robots.txt에 사이트맵 위치 추가
search console에 직접 제출

검색엔진 최적화
- 태그의 올바른 활용
url은 페이지내용과 연관성있는 url
간결하지만 연관성있고 페이지 내용파악이 가능한 제목
사용자가 페이지 내용을 이해할 수 있는 요약글

제목 -> title 태그
가장 효과적인 방법
Meta description 속성 활용

- 텍스트의 최대한 활용
내용을 이미지로 삽입할경우 검색엔진이 내용을 보지 못한다. (접근성에도 불리)

이미지를 이해할 수 있도록
<img src="123.jpg"/>
<img src="강아지.jpg" alt="귀여운 강아지의 사진"/>

정리 -
모든 가능한 정보는 텍스트로 제공
모든 사용자를 위한 콘텐츠 제작
이미지사용시 적절하게 제목과 설명을 덧붙힘

콘텐츠 관리
- 오해

키워드를 분석하여 사용자가 검색할만한 키워드를 전부 포함시키자
같은내용페이지라도 각키워드에 최적한 페이지를 각각따로 준비
콘텐츠 길이는 길수록 좋다
검색엔진이 좋아하는 레이아웃은 정해져있다
아니다!

어떤 콘텐츠를 제공할 것인가?
전문적인, 독창적인, 신뢰있는 콘텐츠

키워드는 서술형으로 제작하는것이 좋다.
스마트 시계 핏비트 스마트워치 핏비트차지3 스마트디바이스
이렇게 단순 나열보다
스마트시계 브랜드인 핏비트는 새로운 스마트워치 핏비트 차지3를 출시했습니다.

사용자입장에서 내용이 이해되도록

url 만으로도 페이지의 내용을 파악할수 있도록 하는것이 중요하다.

대표페이지를 표시해주는 것이 검색엔진의 중복 무시를 예방할 수 있다.
http://me/main -> 대표
http://me/main?type=aaa
속성을 통해 표시할 수있음.

로컬라이제이션 herflang 설정
영어버전 hreflang="en"

한국어버전 herflan="ko" 등

링크의 올바른 활용

앵커 텍스트 활용 - 페이지 내용을 미리 파악할수 있도록

내부링크 - 관련 페이지에 링크 걸기

http vs https 승
http over security layer
- 인증

- 데이터무결성

- 암호화

구글은 모든 웹페이지가 https로 전환되도록 다양한 노력과 투자

https는 보안의기본
랭킹시그널의 하나
차세대 웹을위한 전제조건

http/2

PWA

geolocation api

리다이렉트 설정
어떤형태의 url로 접속해도 https사이트로 접속할수 있도록 설정
ex) www의 유무, http url로 접속시 https로 리다이렉트

모바일 친화적인 페이지를 만들어라
이제 더이상 모바일 프랜들리라는 말을 하지않는다.

mobile first indexing

모바일 사용자의 검색결과에 제외될 수 있다.

반응형페이지로 제작하여 관리하는것이 좋다.
두가지 컨텐츠를 관리하는것은 힘들기 때문.
또한 사용자가 공유를 쉽게할 수 있음! 모바일, pc url이 동일하므로.

사용자는 페이지로딩에 3초이상 시간이 걸리면 페이지 방문을 포기하는 경향이 있다 (53%)
우리나라는 인터넷속도가 매우 빠른편이다. 대부분나라가 우리나라의 절반도 못미치는 인터넷 속도를 가지므로
모든 곳에서 접근가능하다고 생각하고 제작하여야한다.
page speed는 검색의 순위를 결정하는데 반영된다.

결론

검색엔진최적화란?

검색엔진이 사이트를 쉽게 수집하고 색인할수 있도록 설정

서치콘솔 이란?

검색트래픽에대한 보고서와 문제해결을 위한 툴을 제공

저작자표시

'Study' 카테고리의 다른 글

(Redis) Redis란? 우아한 Redis 발표영상 후기 (0)	2020.07.18
Https 통신과정, TCP/IP 핸드 쉐이킹 과정 (0)	2020.07.16
SQL vs NOSQL (관계형데이터베이스 비 관계형데이터베이스) (2)	2020.07.08
(MessageQueue (MQ))란? 왜사용하게 되었을까? (10)	2020.06.30
(Java/RSA) Java RSA 암호화/복호화 구현 (1)	2020.05.21

기록이 곧 발전이다!

[구글검색의 기본과 서치콘솔] 웨비나 정리

1. 구글 검색의 작동 원리

검색 알고리즘

2. 구글 검색기능 활용하기

3. 검색엔진이 이해하는 웹 사이트 만들기

'Study' 카테고리의 다른 글

댓글

티스토리툴바

[구글검색의 기본과 서치콘솔] 웨비나 정리

1. 구글 검색의 작동 원리

검색 알고리즘

2. 구글 검색기능 활용하기

3. 검색엔진이 이해하는 웹 사이트 만들기

'Study' 카테고리의 다른 글

관련글

댓글

티스토리툴바