← 목록으로
업계동향중요도 보통 7.0

치킨과 어떤 음식이 어울리는지 묻는 AI의 답변은 레시피에서 배웠는지 분자에서 배웠는지에 따라 달라짐

Ask AI what goes with chicken and the answer depends on whether it learned from recipes or molecules

The Decoder··3분 읽기·2회 조회

핵심 요약

  • 런던 기반 스타트업 Kaikaku.AI가 'Epicure'라는 AI 모델을 통해 레시피와 분자 구조 기반의 음식 조합 추천을 구분함
  • 모델은 414만 개의 레시피와 FlavorDB 데이터베이스를 기반으로 훈련되었으며, 각 모델은 다른 추천 결과를 제공함
  • 분자 기반 모델은 레시피 기반 모델보다 맛과 영양소 분석이 더 정확함
  • 이 기술은 AI가 음식 조합을 이해하는 방식을 혁신적으로 바꾸며, 응용 분야가 넓어짐

심층 분석

"Epicure"는 음식 페어링 문제를 두 가지 전혀 다른 신호로 분리해 학습시켰다는 점이 기술적 핵심이다. 첫 번째 신호는 414만 개의 7개 언어 레시피 데이터로, "어떤 재료들이 실제로 함께 쓰이는가"라는 사용 패턴(co-occurrence)을 학습한다. 두 번째 신호는 FlavorDB 같은 분자 향미 데이터베이스로, 재료가 공유하는 화학 화합물(휘발성 방향 분자 등)을 기반으로 "화학적으로 유사한가"를 학습한다. 기존 추천 시스템이 이 둘을 뒤섞어 "닭고기에 어울리는 것"을 모호하게 답했다면, Epicure는 레시피 기반 모델과 화학 기반 모델을 명확히 구분해 서로 다른 추천을 내놓는다. 흥미로운 부분은 분자 정보만으로 학습한 모델이 맛·영양 정보를 한 번도 직접 본 적 없는데도 그 값들을 레시피 기반 모델보다 더 잘 분류했다는 점이다. 이는 화학적 구조가 맛·영양이라는 상위 속성의 강력한 잠재 표현(latent representation)으로 작동한다는 증거이며, 임베딩 공간에서 어떤 신호를 주입하느냐가 모델의 일반화 방향을 결정한다는 표현 학습의 전형적 사례다.

엔지니어 관점에서 이 사례가 시사하는 바는 도메인 특화 추천·검색 시스템에서 "데이터 출처의 본질이 곧 모델의 편향 방향"이라는 점이다. 동일한 입력("닭고기")에 대해 학습 데이터의 종류만 바꿔도 출력 의미가 근본적으로 달라지므로, 추천 결과의 "정답"은 사용 맥락에 따라 정의되어야 한다. 익숙한 조합을 원하는 일반 사용자에게는 레시피(행동 데이터) 기반이, 새로운 페어링을 탐색하는 셰프나 R&D에는 분자(구조 데이터) 기반이 적합하다. 이는 음식에만 국한되지 않는다. 추천, 약물 상호작용, 자재 매칭, 콘텐츠 큐레이션 등 "무엇이 무엇과 어울리는가"를 다루는 모든 도메인에서, 협업 필터링(사용 패턴) 신호와 콘텐츠 기반(고유 속성) 신호를 의도적으로 분리·관리하는 설계가 더 통제 가능하고 설명 가능한 시스템을 만든다는 일반 원칙을 보여준다.

실무에서 개발자가 취할 행동은 세 가지로 정리된다. 첫째, 추천/매칭 기능을 설계할 때 "사용 빈도 기반 신호"와 "고유 속성 기반 신호"를 단일 모델에 섞지 말고 분리 가능한 구조로 두는 것을 검토하라. 두 신호를 분리하면 콜드 스타트(신규 항목은 사용 데이터가 없으므로 속성 기반으로 보완) 문제 대응과 추천 근거 설명이 훨씬 쉬워진다. 둘째, 라벨이 없는 속성(여기서는 맛·영양)을 직접 학습시키기 어려울 때, 그 속성과 인과적으로 연결된 저수준 구조 데이터(여기서는 분자 조성)를 대리 신호로 주입하면 명시적 라벨 없이도 상위 속성이 창발할 수 있음을 활용하라 — 자기지도/표현 학습 설계의 실전 패턴이다. 셋째, 평가 단계에서 "어느 모델이 더 정확한가"가 아니라 "어떤 사용자 의도에 어느 모델을 라우팅할 것인가"를 메트릭으로 삼고, 가능하면 두 모델을 함께 노출해 A/B로 의도별 선호를 측정하라. 단일 정답을 가정한 평가는 이런 다관점 시스템의 가치를 오히려 가린다.

#AI#레시피#음식#머신러닝#Epicure
원문 보기 →

관련 기사