Yo escogí que las palabras con significado parecido y las que se usan juntas en frases están cerca en el espacio de embeddings. Eso tiene sentido porque el modelo aprende cómo hablamos y cómo se conectan las palabras. Las otras opciones no siempre se cumplen.