퓨 리서치 센터의 한 연구에 의하면 72%의 사람들이 온라인에서 자신들이 하는 행동이 광고주 혹은 광고 기술 회사들에 의해 추적당하고 있다고 느끼고 있고 81%의 사람들은 노출된 데이터로 인해 잠재적 피해를 입을 것이라고 불안해 한다고 한다. 이런 점 때문에 구글은 2020년 구글 크롬이 써드파티 쿠키에 대한 지원을 중단하겠다고 발표했던 것이고, 2022년부터는 개인 식별 정보를 사용한 광고도 더 이상 판매하지 않을 것이라고도 발표했다. 사실 이미 오래전부터 개인 정보 보호 강화에 대한 요구에 따라 사파리와 파이어폭스 등의 브라우저는 써드 파티 쿠키 지원을 일찍 부터 중단해왔다. 그러나 구글은 크롬 브라우저뿐만 아니라 막대한 수익을내는 광고 사업에 미치는 영향을 고려해서 써드 파티 쿠키 지원을 유지해오다가 최근에서야 새로운 정책을 도입한 것이다.
광고에서 수익의 반절 이상을 얻고 있는 구글이 이런 발표를 통해 자신들의 수익원을 단순히 포기하겠다고 선언하는 것일까? 당연히 아니다. 구글은 써드파티 쿠키를 금지하고 개인 식별 정보 기반의 광고 판매를 중지하는 대신에 광고주에게 개별 이용자 식별 데이터를 제공하지 않으면서도 이용자들의 관심 기반 광고가 가능하도록 하게 하는 새로운 광고 시스템 FLoC API를 발표했는데, 이 새로운 광고 시스템은 구매 전환 효과 기준에서 기존 쿠키 기반 광고 대비 95% 이상을 기록했다고 하는 것으로 봐서 광고주들에게 큰 어려움을 주는 일은 일단 없을 것이라고 봐도 될 것 같다. 또한 구글의 입장에서도 새로운 시스템 도입이 자신들의 매출에도 큰 피해를 주지는 않을 것으로 판단하고 있는 걸로 보인다.
구글의 플록(FLoC)란 무엇인가?
개인 식별 정보 기반 타겟 광고를 대신해서 이번에 개인 정보가 강화 된 광고 솔루션으로 발표한 구글의 FLoC (Federated Learning of Cohorts)는 비슷한 관심사를 가진 사람들을 클러스터링하여 이들이 관심을 가지고 있는 콘텐츠와 광고를 통해 광고주들이 이들 그룹내의 사람들에게 접근 할 수 있게하는 새로운 방법이다. 이 접근 방식은 특정 성향을 공유한 그룹 안에 있는 개인 식별 정보와 웹 사용 기록을 비공개 상태로 유지하면서도 광고주가 광고 집행 가치를 떨어뜨리지 않을 것이란 기대를 받고 있다.
여기서 집단 연합 학습 (Federated Learning of Cohorts)이란 각 개인 유저 구글 크롬 브라우저의 로컬 데이터와 중앙 서버에 전달하지 않으면서도 이들을 연계하여 탈중앙화된(개인 식별 정보를 중앙 서버로 가져오지 않은 채로 분산된 상태에서 학습을 시킨다는 의미) 학습을 수행하는 구글 키보드에 2017년에 적용하며 주목 받았던 기술이다. 사용자의 개별 입력 기록을 학습하여 사용자가 입력하려는 키워드를 추천해주는데 필수적인 학습을 수행하면서도 유저의 개별 입력 기록을 중앙서버로 보내지 않으며 학습을 시키는 기술이라고 말할 수 있다. 구글은 이번에 이 기술을 타사 쿠키를 통해 수집한 개인정보를 광고주나 광고 기술 회사로 보내지 않으면서도 높은 정확도로 소비자 관심 기반으로 광고를 집행할 수 있게 하는 시스템을 만드는데 사용한 것이다.
왜 이런 복잡한 학습 방식을 사용하는 이유는 개인 정보를 보호하기 위함이다. 이런 조치가 필요한 이유에 대해서는 캠브리지 애널리틱스의 스캔들을 다룬 넷플릭스의 다큐멘터리 거대한 해킹과 같은 영상을 통해서도 쉽게 이해할 수 있다. 개인 정보에 접근하여 다양한 컨텐츠를 제공하는 알고리즘을 만드는 소프트웨어 엔지니어와 그의 선의에 너무나 많은 것을 맡겨서 안된다. 이 관점에서 구글의 FLoC API는 개인 식별 정보로서 악용의 여지가 큰 써드파티 쿠키없는 인터넷을 향한 중요한 첫발이라고 할 수 있다.
터틀도브(Turtledove)란 무엇인가?
개인의 프라이버시를 강조하기 위해 구글이 추진하고 있는 FLoC와 동시에 추진 중인 광고 시책 중에 터틀도브(Turtledove)라는 것이 있다. 이것은 광고주에게 FLoC와 유사하게 사용자 프라이버시를 유지하면서도 자신들의 잠재 고객을 대상으로 리타게팅을 할 수 있게 제공하는 시책이다. 터틀도브 API(Turtledove API)는 현재 페이지에 대한 정보와 함께 사용자가 이전에 관심을 표명 한 광고주에 대한 정보를 브라우저에 저장한다. 그 이후에 광고주가 정의한 관심사 기반 광고와 문맥 데이터 기반 광고를 요청하는데, 이들 두개의 광고는 독립적이므로 광고 네트워크는 이 두개의 요청이 동일한 브라우저에서 온다는 것을 알아차리기 어렵다. 그 다음으로 각 브라우저는 광고주가 제공 한 자바 스크립트 코드를 사용해서 자신의 웹 페이지에 표시할 관련성 높은 광고를 선택한다.