구글은 시맨틱웹에 관심 없다?

구글이 Searchology 09라는 행사를 통해 자기들의 새로운 검색 서비스들을 선 보였다. 그 중에 Rich Snippets이라는 기능을 위해 시맨틱 웹 분야에 있는 사람이라면 어제의 뉴스는 “ RDFa와 Microformat 지원“이 알려졌다.

Rich Snippets라는 이들 포맷이 지원하는 리뷰 결과 등 의미있는 데이터를 분석해서 검색 결과에 약간 멋있게 보여 준다는 것이다. 예를 들어 아래와 같은 검색 결과를 만들기 위해...


Microformat의 hreview를 이용한다던가...

RDFa의 용어 중 review type을 쓰는 식이다.

이 소식이 나오고 나서 많은 시맨틱 웹 관련  연구자나 기업, 관심자들이 이제 구글이 시맨틱 웹을 지원하는 것인가? 하는 논의가 시작되었다. 물론 구글은 이들 포맷을 지원하는 첫번째 검색엔진은 아니다. Yahoo! SearchMonkey는 이미 이들을 지원하고 있다.

최근에 웹3.0을 주장하는 많은 사람들이 시맨틱 웹 혹은 시맨틱 웹 검색 엔진이 차세대 웹이라는 Buzz를 펴고 있는 상태이다. 하지만, 실제 웹 2.0이 소셜 데이터를 이끌어 내는 원동력임을 감안했을 때 오히려 소셜 컴퓨팅의 영역으로 간다는 한상기 박사님의 의견에 공감이 가는 편이다.

즉, 사람이 웹을 적극적으로 만들고 이용해 가는 방식이 더 공고해졌다는 것이다. 여기서 시맨틱 웹 기술은 최소한의 소통 장치의 역할만을 하고 있다.

Sonagi님의 블로그에서 시맨틱웹, 구글, RDFa라는 글에는 시맨틱 웹 연구자의 걱정과 실망감이 잘 드러나 있다.

O’reilly Radar의 뉴스와 댓글을 보면 구글의 새로운 도전을 긍정적으로 생각하는 것 같다. 역시 즐거운 소식은 RDF를 이용해서 데이터를 구조화시키는데 구글이 관심을 보였다는 것이다. 적어도 시맨틱 웹의 비전에 대해 “최소“의 필요성은 인정했다라고 해석할 수 있을까? 2006년 좀 심하게 무시했던 것과 비교하면 진일보했다. 우울한 것은 구글이 접근하는 방법이다.

구글은 RDFa를 지원하지만 기존에 만들어진 RDF 어휘들 - FOAF, SIOC - 을 지원하지 않을 계획이다. 정확히 말하면 아주 새로운 어휘를 만들 계획이다.

data-vocabulary.org 가 그런 역할을 하지 않을까? Ian은 그동안 만들어지고 사용되고 있는 어휘들을 무시한채 구글의 방식대로 진행되는 것을 지적하고 있다. 구글도 점점 마이크로소프트처럼 행동한다는 생각이 드는 이유가 왜인지?
Microformat과 RDFa가 왜 탄생했는지 알아야 할 필요가 있다. 이 두 가지 포맷은 HTML에 직접 Annotation할 수 있는 포맷들이다. 즉, HTML만 좀 아는 사람이면 누구나 정보를 기재할 수 있고, 시맨틱웹을 모르는 일반 웹 개발자도 자신의 웹 사이트에 관련 정보를 표시할 수 있다는 장점이 있다.

이는 기존의 시맨틱 웹 어휘 혹은 온톨로지가 '심하게' 복잡하다는 것을 반증하는 것이다. 나 스스로도 FOAF 파일을 만들기 위해 Generator를 쓰지 않으면 안되었는데 실제로 나온 결과는 마이크로포맷의 hCard와 크게 다르지 않다.

왜냐면 FOAF의 어휘중 웹에서 쓸 수 있는 건 극히 일부분이기 때문이다. 나처럼 웹에다 모든 걸 드러내놓고 사는 사람도 전화 번호나 상세 집주소는 노출 하지 않는다. 그런데 FOAF 같은 어휘를 모두 써서 웹에다 노출한다는 것이 얼마나 큰 문제인가?

구글이 원하는 것은 크롤링한 HTML의 의미적 데이터를 어떻게 유용하게 활용할 것인가 하는 문제의 결론이지 시맨틱 웹을 적용한건 아닐 것이다. 만약 구글이 자체의 어휘를 만든다 해도 시맨틱 웹 연구자들이 뭐라할 상황은 아니지 않을까? 원래 HTML의 시맨틱 마크업이 시맨틱 웹의 영역은 아니였으니...

결국 미래는 소셜 웹 세계에서 시맨틱 마크업이 얼마나 쓰일 것이냐 혹은 그걸 얼마나 활용(Utilization)할 것인가의 문제이지 시맨틱 웹으로 진입이라는 것은 쉽게 일어나지 않을 것 같다. 지금까지도 그랬던 것 처럼 시맨틱 웹은 여전히 인트라넷이나 특정 도메인의 웹 기반 서비스 처럼 보이지 않는 웹(Invisible Web)에서 주로 활용될 가능성이 높고, 웹으로 커밍아웃하기에는 아직 멀어 보인다.

소셜 데이터 웹의 최전선에 있는 DBpedia의 LinkedData들이 일상적인 웹 세계에 제대로 활용되기 위해서는 더 쉬운 뭔가가 있어야 한다. 언제나 그랬던 것 처럼 웹은 쉬워야 하니까...
  1. 이동균 2009.05.14 15:01
    좋은 글 잘 읽었습니다.
    한상기 박사님의 블로그 컨텐츠도 완전 마음에 드네요
  2. hardboil 2009.05.14 15:15
    좋은 글 잘 읽고 갑니다 =)
  3. 모노피스 2009.05.15 10:44
    아...어렵습니다. ㅡㅡ;;;
  4. jamiepark 2009.05.20 16:31
    RDF 검색했다가 이글이 나와서 참고했는데,
    이 "차니"가 그 "차니"인줄 몰라뵈었네요^^

    좋은 연구활동 많이 하세요!
  5. Bardisch 2009.05.22 19:49
    아... 전 아직 바보인가봅니다...