Epicure 论文深度解读:把食材嵌入从推荐模型变成可导航的风味地图
系统解读 arXiv:2605.22391v1 Epicure 论文:多语言菜谱语料、化学-共现双图、三种 Metapath2Vec 食材嵌入、几何探针、SLERP 风味导航与方法局限。
研究对象:Epicure: Navigating the Emergent Geometry of Food Ingredient Embeddings,arXiv:2605.22391v1,2026-05-21 提交。
作者:Jakub Radzikowski、Josef Chen,KAIKAKU.AI。
本文基于 arXiv HTML、PDF、TeX source、ancillary CSV/README 交叉核对。
执行摘要
Epicure 研究的是一个很具体但很有想象力的问题:如果把食材当成词,把菜谱中的共现关系和风味化合物关系当成上下文,能不能得到一个既懂“鸡肉常和蒜、洋葱一起出现”,又懂“鸡肉、牛肉、猪肉在风味轮廓上相近”的食材向量空间?论文给出的方案不是训练一个生成式模型,而是回到 word2vec / Metapath2Vec 风格的 300 维 skip-gram embedding,用 4.14M 多语言菜谱、1,790 个规范化食材、203,508 条食材共现边、80,019 条食材-化合物 typed edges,训练三套只在随机游走 schema 上不同的 sibling embeddings:Cooc、Core、Chem。
这篇文章真正有意思的地方,不在“做了一个食材推荐模型”,而在把 chemistry vs recipe-context 变成了可控实验轴。Cooc 只看菜谱共现,回答“现实菜谱里常和什么一起用”;Chem 只走化合物介导的 metapath,回答“风味化学上像谁”;Core 则把二者混合。因为三者共享词表、图节点、训练超参和大部分图结构,所以输出差异可以较干净地归因到 walk schema,而不是语料、模型容量或调参噪声。
论文的主要结论是:三种 embedding 都能线性恢复 27 个连续感官/营养方向和 8 个菜系区域;Chem 在几乎所有方向质量指标上最好,Cooc 更像真实烹饪搭配,Core 的空间更集中但 emergent modes 最紧。作者进一步用 FastICA + GMM 从每个模型中抽出 20 个稳定因素和 150-200 个命名 culinary modes,再用 nearest-neighbor、mode-membership lookup、SLERP direction arithmetic 做“风味导航”。这使它更像一个厨师工具底座,而不仅是一个 pair recommendation benchmark。
1. 论文基本信息
| 项目 | 内容 |
|---|---|
| 标题 | Epicure: Navigating the Emergent Geometry of Food Ingredient Embeddings |
| arXiv | https://arxiv.org/abs/2605.22391 |
| 版本 | v1,2026-05-21 提交 |
| 分类 | cs.AI;cs.CL;cs.CY |
| 作者 | Jakub Radzikowski, Josef Chen |
| 机构 | KAIKAKU.AI |
| 核心方法 | Metapath2Vec / skip-gram over ingredient and compound graphs |
| 核心产物 | Epicure-Cooc、Epicure-Core、Epicure-Chem 三套 300-D 食材嵌入 |
| 数据规模 | 4,135,189 recipes;1,790 canonical ingredients;203,508 I-I edges;80,019 typed I-C edges |
一个需要特别记录的细节:论文摘要末尾写着 “Code and trained artefacts are not released at this time”,但 arXiv abstract 页面实际列出了 ancillary files,包括 epicure_cooc.csv、epicure_core.csv、epicure_chem.csv、vocab.csv 和多份 evaluation CSV。也就是说,代码未发布,但 embedding CSV 和分析表格已经随 arXiv ancillary files 发布。这可能是论文正文没有同步更新。
2. 研究背景:计算美食学里缺的不是“更多推荐”,而是可控表征
计算美食学过去有两条主线。
第一条是 chemical food pairing。Ahn et al. 2011 的 flavor network 论文把食材之间共享风味化合物的关系系统化,发现不同文化对“共享化合物”的利用方式不同:北美/西欧菜系更偏向共享化合物的搭配,而东亚菜系更常避开共享化合物。这个工作奠定了“用化学网络解释风味搭配”的路线。
第二条是 recipe-context embedding / food graph。FlavorDB 提供食材-风味分子数据库,Recipe1M+ 提供大规模菜谱,FlavorGraph 2021 把 FlavorDB chemistry 和 Recipe1M+ co-occurrence 合在一个异构图里,用 Metapath2Vec 得到食材表征。FlavorGraph 是 Epicure 的直接前作,也是论文反复比较的对象。
Epicure 认为 FlavorGraph 有三个限制:
| 限制 | FlavorGraph/旧路线的问题 | Epicure 的处理 |
|---|---|---|
| 语料偏向 | 主要依赖英文中心菜谱语料 | 聚合 11 个公开数据源、覆盖多语言和多菜系 |
| 词表噪声 | 食材名包含品牌、准备方式、非食物项 | LLM + embedding clustering + manual curation 归一到 1,790 canonical ingredients |
| 信号混合不可控 | 化学信号和共现信号被固定融合 | 用 Cooc/Core/Chem 三个 sibling model 把 walk schema 变成实验变量 |
这也是论文的关键范式转移:它不是问“哪个 embedding 最好”,而是问 当我们有意改变图游走暴露给 skip-gram 的上下文类型时,食材空间的几何性质怎样变化。
3. 方法论:五阶段流水线
flowchart TD
A[11个公开菜谱数据源<br/>4.14M recipes] --> B[机器翻译和NER抽取<br/>约20万原始食材字符串]
B --> C[LLM分类 + Gemini embedding聚类<br/>人工终审]
C --> D[1,790 canonical ingredients]
D --> E[共现图<br/>203,508条正NPMI I-I边]
D --> F[FlavorDB typed compound图<br/>2,247 compound nodes<br/>80,019条I-C边]
E --> G[Cooc<br/>只走I-I共现]
E --> H[Core<br/>typed compound walks<br/>外加10倍I-I注入]
F --> H
F --> I[Chem<br/>只走compound-mediated walks]
G --> J[300-D embeddings]
H --> J
I --> J
J --> K[方向探针<br/>ICA/GMM modes<br/>SLERP导航]
3.1 语料与词表
论文聚合 4,135,189 条菜谱,来源包括 RecipeNLG、下厨房 XiaChuFang、Povarenok,以及越南语、西班牙语、土耳其语、印度英语、印尼语、德语等公开数据集。语料非常不均衡:RecipeNLG 占 53.9%,下厨房占 37.4%,俄语 Povarenok 占 3.5%,其他来源都小得多。
非英语食材先用 Claude Opus family deterministic decoding 翻译成英语,再进入规范化流程。原始 NER 产生约 200,000 个 unique ingredient strings,里面混有拼写变体、品牌名、非食物、处理方式和长短不一的食材短语。作者用 LLM 做 term classification,用 Gemini embedding 做 semantic clustering,再人工终审,最终得到 1,790 个 canonical ingredients。
这个步骤非常关键,因为食材 embedding 的质量很大程度上取决于节点定义。如果词表里同时有 tomato、italian plum tomato、diced tomato、tomato sauce、品牌番茄罐头,它们会把共现信号拆碎。Epicure 用小而干净的规范词表换取更可解释的几何结构。
3.2 图构建
Epicure 构建两类图:
| 图 | 节点 | 边 | 作用 |
|---|---|---|---|
| Cooc graph | 1,790 食材节点 | 203,508 条正 NPMI 食材-食材边 | 捕获“同一道菜谱中常一起出现”的 recipe context |
| Core/Chem graph | 1,790 食材 + 2,247 typed compound nodes | 203,508 I-I 边 + 80,019 typed I-C 边 | 捕获食材与 15 类风味化合物之间的 typed chemistry context |
typed compound 的设计比 FlavorGraph 更细。FlavorGraph 的 compound type 更粗,Epicure 把 compound 按 15 个 flavor-category tags 复制为 typed nodes,例如 citrus、earthy、fatty、floral、meaty、nutty、spicy、woody 等。这样 Metapath2Vec 的 typed walk 可以区分“通过 citrus compound 相连”和“通过 earthy compound 相连”。
3.3 三个 sibling models
三套模型共享全部训练超参:300 维 embedding、walks_per_node=100、walk_length=50、context window=7、negative samples=5、batch size=32,768、learning rate=0.0025、SparseAdam、20 epochs、fixed seed=42。差别只在 walk schema:
| 模型 | walk schema | 直观含义 |
|---|---|---|
| Epicure-Cooc | 只在食材-食材 NPMI 图上随机游走 | 菜谱搭配空间:什么常一起被做 |
| Epicure-Core | typed compound walks + ii_repeat=10 的 I-I walk 注入 | 混合空间:化学信号和菜谱共现都强 |
| Epicure-Chem | typed compound walks,ii_repeat=0 | 化学空间:什么共享风味化合物结构 |
对非化学 hub 食材,论文设计了 N-H-C[x]-H-N 这类 via-compound metapath,让没有直接 FlavorDB compound edge 的 1,267 个 non-hub ingredients 也能通过 hub ingredient 间接获得化学上下文。但这也带来一个局限:non-hub 的化学信号比 523 个 hub ingredients 多走了一跳,信息更弱、更间接。
4. 核心结果:三种几何空间各有性格
4.1 内在几何与聚类
| 指标 | Cooc | Core | Chem | 解读 |
|---|---|---|---|---|
| Participation ratio | 173.6 | 94.2 | 183.1 | Cooc/Chem 更 isotropic;Core 更集中 |
| Avg. pairwise cosine | 0.099 | 0.349 | 0.117 | Core 的整体向量更互相靠近 |
| USDA food-group NMI | 0.205 | 0.235 | 0.226 | 三者都能无监督恢复食物组结构,Core 略高 |
| Cuisine soft NMI | 0.457 | 0.456 | 0.432 | 菜系结构比食物组更明显 |
| Cuisine kNN@5 Jaccard purity | 0.652 | 0.695 | 0.677 | Core 在局部菜系邻域上最高 |
这里有个重要判断:Core 的低 participation ratio 不一定是坏事。普通 word embedding 里空间塌缩通常需要 all-but-the-top 或 whitening 修复,但 Epicure 作者认为 Core 的集中性是 ii_repeat=10 强 recipe-context 注入的结果,是一个设计选择。它牺牲 isotropy,但换来更紧的 modes 和不错的线性 probe。
4.2 方向质量:Chem 几乎全胜
论文用 supervised linear direction probes 检查 embedding 是否能线性恢复已知属性。连续 probe 包括 14 个 baked-in compound-feature sensory categories、5 个 held-out basic tastes、8 个 USDA macronutrients;菜系 probe 用 8 个 macro-regions 的 one-vs-rest Cohen’s d。
| Probe stratum | Cooc | Core | Chem |
|---|---|---|---|
| Baked-in compound-feature sensory, Spearman mean | 0.28 | 0.40 | 0.46 |
| Held-out basic taste, Spearman mean | 0.32 | 0.42 | 0.47 |
| USDA macronutrient, Spearman mean | 0.41 | 0.45 | 0.49 |
| Cuisine macro-region, mean Cohen’s d | 2.43 | 2.70 | 3.07 |
这个结果有点反直觉:Chem 只看化学 metapath,却在菜系 macro-region 上也最好。论文的解释是,风味化合物作为结构先验,不只强化直接看到的 compound-feature,也让更广泛的 culinary concepts 更容易被线性读出。也可以换一种说法:菜系差异并不只是“哪些食材共现”,也深深嵌在香气分子和调味体系里。
4.3 Emergent factors 与 modes
作者在 food-group-residualised embeddings 上跑 multi-seed-stable FastICA,每个模型提取 20 个稳定 factors。随后对每个 factor 的 top quartile ingredients 用 PCA-reduced space + GMM 分成 modes,并用 BIC 在 K=3..7 之间选择,最小 mode size 为 6。
得到的 modes 数量:
| 模型 | Stable ICA factors | Modes | Emergent mode coherence | Random baseline |
|---|---|---|---|---|
| Cooc | 20 | 150 | 0.611 | 0.097 |
| Core | 20 | 193 | 0.833 | 0.348 |
| Chem | 20 | 200 | 0.703 | 0.115 |
这些 modes 被命名为诸如 “Sweet baking and dessert ingredients”“South Asian whole spice blends”“Mexican & Latin American Pantry” 之类的 culinary neighborhoods。注意这里不是简单地给每个 factor 起名字;作者强调 factor index 只是坐标,真正可解释的是 factor top quartile 内被 GMM 切出来的 mode。
Core 的 absolute coherence 最高,但它的 random baseline 也高,因为整个空间更集中。因此更公平的看法是:三者的 coherence-baseline margin 都大约在 0.5 左右,说明 modes 都显著强于随机局部邻域。
5. 从 embedding 到“可导航工具”:Pairings 与 SLERP
论文最有产品意味的部分是 transformations。作者把 embedding 空间上的操作分成两类。
5.1 Nearest-neighbor pairings
同一个 seed ingredient,在不同 sibling model 下返回不同类型的邻居:
| Seed | Cooc 返回 | Core/Chem 返回 | 解释 |
|---|---|---|---|
| chicken | garlic、onion、black pepper、turkey、carrot | pork、beef、chicken broth、cream of chicken soup 等 | Cooc 像“菜谱里常搭配什么”;Chem/Core 像“风味/蛋白类别上接近什么” |
| basil | parsley、olive oil、parmesan、black pepper、white wine | oregano、tarragon、rosemary、pasta 等 | Cooc 给烹饪上下文;Chem/Core 给草本香料簇 |
| soy sauce | sesame oil、shiitake、ginger、oyster sauce | light soy sauce、shaoxing wine、doubanjiang 等 | 共现搭配和东亚调味簇都可解释 |
这说明三个模型不是谁替代谁,而是回答不同厨师问题:
- Cooc:我手里有这个食材,现实菜谱里通常还会拿什么?
- Chem:如果我要找风味轮廓近似的替代或变体,谁更像?
- Core:我想在真实烹饪搭配和化学轮廓之间折中。
5.2 Mode-membership lookup
nearest neighbor 只能告诉你附近是谁,mode-membership lookup 则告诉你这个 seed 坐落在哪个命名 culinary neighborhood。例如 chocolate 在三套模型里都落入甜点/糖果相关 mode,但 mode 的文化和成分构成不同;miso 在 Cooc/Core 更接近日式火锅/蔬菜/鲜味调味,而 Chem 会更偏到 savory protein-rich seafood and cheese 这类化学相似结构。
这使 embedding 不只是推荐列表,而是一个“可解释地图”:用户可以看到食材属于哪个区域,以及这个区域还有哪些成员。
5.3 SLERP direction arithmetic
SLERP 是 spherical linear interpolation。论文把 seed vector 在单位球面上朝某个方向或 mode pole 旋转,角度 theta 控制移动幅度。0 度是不动,60 度时与 seed 的 cosine similarity 降到 0.5,目标方向开始主导检索。
典型例子:
| 查询 | 角度 | 结果含义 |
|---|---|---|
| rice + South Asian | 30/60 度 | 逐步从 rice 的原邻域移动到 curry leaf、urad dal、chana dal、fenugreek seed 等南亚语义方向 |
| corn + Latin American | 30/60 度 | 移到 tomatillo、queso fresco、corn tortilla、salsa verde 等拉美 pantry |
| chicken + processed + Western Atlantic | 60 度 | 移到 ranch dressing、cream of chicken soup、cheddar/colby cheese、alfredo sauce 等美国加工食品/家庭菜谱方向 |
| chocolate + sweet baking mode | 60 度 | Cooc/Core 更偏西式甜烘焙;Chem 可落到 red bean paste、matcha powder、mochi 等东亚甜点 mode |
这个设计是论文最值得借鉴的工程点:它把 embedding 从“给我 top-5”升级成“给我一个可调旋钮”。厨师或产品用户不必一次性跳到目标菜系,可以通过角度控制探索粒度:小角度保留 seed identity,大角度进入目标语义场。
6. 批判性分析
6.1 优点
第一,实验控制干净。 三套模型共享语料、词表、节点、边集合、训练超参,只改 walk schema。这比“拿两个不同模型比较”更能说明化学信号和菜谱上下文各自如何塑造 embedding geometry。
第二,词表治理有现实价值。 FlavorGraph 的邻居例子里会出现长品牌名、处理方式甚至非食品词。Epicure 把词表压到 1,790 canonical ingredients,牺牲覆盖率,但显著提高了解释性。对于 chef-facing 工具,这个选择是合理的。
第三,评价不只看推荐命中率。 论文同时看 isotropy、NMI、linear probes、ICA stability、mode coherence、SLERP examples,评估对象是“空间是否可读、可控、可导航”,而不是单一离线推荐指标。
第四,operator 设计比模型本身更有启发。 Nearest neighbor、mode lookup、supervised SLERP、emergent SLERP 共同组成一套交互原语。把模型偏差显式暴露为 sibling selection 和 angle selection,比隐藏在一个黑盒推荐器里更可控。
6.2 局限
语料不平衡削弱“多语言/多文化”的强表述。 4.14M recipes 中 RecipeNLG 和下厨房合计超过 91%,East Asian 和 English-centric Western data 支配了训练语料。South Asian、Latin American、Japanese 等区域样本量小很多,论文也承认低样本区域的 confidence intervals 更宽。因此 Epicure 更准确的定位是“引入多语言信号的跨菜系 embedding”,而不是均衡全球料理地图。
LLM 介入较深,可能引入不可见偏差。 机器翻译、term classification、canonicalisation、cuisine tagging、mode label generation 都依赖 Claude/Gemini 系模型。作者强调 embedding 训练本身不直接看 LLM judgement,但节点集合、标签和可解释命名都被 LLM 管道塑造。对于文化菜系标签,这尤其敏感:什么是“distinctive marker”,哪些食材被视为 universal,都会影响后续结论。
缺少真实下游任务验证。 论文展示了很多内部几何指标和 qualitative hero cases,但没有用户研究、厨师盲评、recipe generation A/B test、substitution success benchmark,或与 FlavorGraph/FoodKG 在真实 pairing/recommendation 任务上的系统量化比较。它证明了空间“看起来可导航”,但还没证明这个导航在厨房或产品里真的更有用。
化学覆盖有限。 只有 523/1,790 个食材保留 active typed I-C edges,剩余 1,267 个 non-hub 只能通过 via-compound metapath 间接接触化学上下文。Chem 的表现很强,但对 non-hub 食材的化学解释需要更谨慎。
SLERP 的语义线性假设仍需外部验证。 Word embedding 里的方向运算有启发性,但并不保证每个 culinary concept 都是球面上平滑可插值的方向。角度旋钮在例子里很漂亮,但是否稳定适用于长尾食材、复合约束、过敏/营养限制等实际场景,需要系统 benchmark。
代码未发布。 arXiv ancillary files 里有 embedding 和 CSV,但训练代码、数据处理代码、LLM prompts、人工审核记录并不完整公开。复现实验主流程仍有障碍。
7. 和前作的关系
| 工作 | 核心贡献 | Epicure 的继承与变化 |
|---|---|---|
| Ahn et al. 2011, Flavor Network | 用共享风味化合物解释 food pairing 与文化差异 | Epicure 继承“化学结构影响烹饪搭配”的前提,但把它变成 typed compound walk |
| FlavorDB | 提供食材-风味分子数据库 | Epicure 用 FlavorDB 构造 I-C typed edges 和 sensory labels |
| Recipe1M+ / RecipeNLG | 大规模菜谱语料与图文菜谱资源 | Epicure 扩展到 11 个公开数据源,但语料仍高度不均衡 |
| FlavorGraph 2021 | 融合 FlavorDB 与 Recipe1M+,用 Metapath2Vec 训练食材 embedding | Epicure 的直接 baseline;区别是规范词表、多语言语料、typed compounds、三 sibling walk schema |
| FoodKG 2019 | RDF/ontology 式 food knowledge graph | Epicure 不走 symbolic KG,而是在同一 dense space 里同时提供 nearest neighbor 与 named mode lookup |
| Radzikowski & Chen 2026 前作 | 证明 FlavorGraph embedding 中存在可解释 culinary dimensions | Epicure 从“分析既有 FlavorGraph”升级为“重新训练可控 sibling embeddings” |
8. 这篇论文对 AI/产品工程的启发
8.1 “同一数据,多种视角”比“一模到底”更适合探索型工具
Epicure 没有追求一个单一最优 embedding,而是保留 Cooc/Core/Chem 三个 sibling。这个设计适合探索型产品:用户的问题本来就不同。菜谱创作时,“常和什么一起出现”“什么风味像它”“如何跨菜系迁移”是不同任务,强行压成一个相似度会损失控制权。
8.2 可解释的 embedding 工具需要操作原语,而不只是向量
很多 embedding 项目止步于 nearest neighbor。Epicure 的价值在于提供了更高层操作:
- sibling selection:选择共现、混合、化学视角。
- closest-mode lookup:把食材定位到命名区域。
- supervised direction:朝人工标签定义的方向移动。
- emergent mode pole:朝无监督发现的 culinary neighborhood 移动。
- SLERP angle:控制 seed identity 与 target intent 的比例。
这套原语可以迁移到其他领域,例如药物分子、材料配方、香水调香、咖啡/葡萄酒风味、音乐采样、产品搭配等。只要有“共现上下文 + 物理/化学/结构属性”双重信号,就可以借鉴 sibling embedding 的思路。
8.3 LLM 在这里更像数据清洗和标注层,不是核心模型层
Epicure 的主模型是传统 skip-gram embedding,但 LLM 参与了翻译、规范化、菜系标签、mode 命名。这是一个很实际的组合:LLM 用在非结构化数据清洗和人类可读命名上,几何学习仍交给简单、可控、便宜的 embedding 模型。
风险也同样清楚:LLM 的文化偏见和分类偏见会进入节点集合与标签体系。所以如果要产品化,需要保留 prompts、审计样本、人工纠错界面和 region-specific curator。
9. 如果要继续研究,我会补哪些实验
- 厨师盲评实验:给专业厨师看 Cooc/Core/Chem 生成的 pairing/substitution,按“可用性、惊喜度、文化合理性、风味合理性”打分。
- Recipe completion benchmark:遮掉菜谱中的一个关键食材,让模型根据剩余食材和目标菜系推荐补全项,和 FlavorGraph、FoodKG、LLM baseline 比较。
- Substitution benchmark:围绕过敏、素食、低钠、高蛋白等约束,测试替代食材是否在感官、营养和烹饪功能上同时合理。
- 语料平衡消融:下采样 RecipeNLG/下厨房,上采样小语种,观察 cuisine direction 与 mode atlas 是否稳定。
- LLM 管道消融:比较不用 LLM canonicalisation、只用 embedding clustering、只用人工小词表等版本,量化 LLM 清洗到底贡献多少。
- non-hub 诊断:把 523 个 chemical hubs 和 1,267 个 non-hubs 分开报告方向质量与 pairings,避免 Chem 的平均表现掩盖覆盖差异。
- 开源复现包:发布训练脚本、walk generator、prompts、审核样本和固定随机种子,让其他团队能替换 FooDB、USDA 或本地菜谱库。
10. 结论
Epicure 是一篇有趣的 embedding 论文,因为它把一个看似边缘的垂直领域做出了清晰的方法论:在同一规范词表和同一图底座上,只改变 random-walk schema,就能得到三种性格不同但可比较的食材空间。Cooc 代表菜谱实践,Chem 代表风味化学,Core 代表二者混合。这个 controlled sibling design 比单纯堆数据或换模型更有解释力。
论文最强的贡献不是某个分数,而是把食材 embedding 变成了可操作的风味地图:用户可以选择视角、查询邻居、查看命名区域、沿监督方向或无监督 mode 旋转,并用角度控制探索强度。这种“导航式 embedding”很适合 chef-facing 创作工具,也对其他配方/组合优化领域有启发。
但这项工作还停留在研究原型层。语料严重不平衡、LLM 参与过多、真实下游验证不足、代码未发布、化学覆盖有限,都会限制它被直接当作生产级推荐系统。更稳妥的定位是:Epicure 提供了一个优秀的表征设计样板和一批可试用 embedding artifacts,下一步需要真实用户评估和可复现实验来证明它不仅“几何上漂亮”,也确实“厨房里好用”。
参考资料
- Jakub Radzikowski, Josef Chen. Epicure: Navigating the Emergent Geometry of Food Ingredient Embeddings. arXiv:2605.22391v1, 2026.
- arXiv ancillary files for 2605.22391: embeddings CSV、mode atlas、linear probe、SLERP full table、supplementary CSVs, listed on the arXiv abstract page.
- Yong-Yeol Ahn et al. Flavor Network and the Principles of Food Pairing. Scientific Reports, 2011.
- Neelansh Garg et al. FlavorDB: A Database of Flavor Molecules. Nucleic Acids Research, 2017.
- Donghyeon Park et al. FlavorGraph: A large-scale food-chemical graph for generating food representations and recommending food pairings. Scientific Reports, 2021.
- Steven Haussmann et al. FoodKG: A Semantics-Driven Knowledge Graph for Food Recommendation. ISWC, 2019.
- Yuxiao Dong et al. metapath2vec: Scalable Representation Learning for Heterogeneous Networks. KDD, 2017.
- Tomas Mikolov et al. Distributed Representations of Words and Phrases and their Compositionality. NeurIPS, 2013.
- Jakub Radzikowski, Josef Chen. Epicure: Multidimensional Flavor Structure in Food Ingredient Embeddings. arXiv:2604.22776, 2026.