Esta página se tradujo automáticamente con la API de traducción de Google Cloud.
Algunas páginas se pueden leer mejor en su totalidad.
TensorFlow.js es una biblioteca de JavaScript para entrenar e implementar modelos de aprendizaje automático en el navegador y en Node.js.
En este tutorial, aprenderemos a mezclar y agrupar datos con TensorFlow.js. Cubriremos los siguientes temas:
Al entrenar modelos de aprendizaje automático, es importante mezclar los datos antes de cada época. Esto se debe a que, si los datos no se mezclan, el modelo podría sobreajustarse en las primeras muestras del conjunto de datos.
El barajado de datos es el proceso de reordenar aleatoriamente las muestras en un conjunto de datos. Esto se puede hacer antes o después de cada época.
Hay dos ventajas principales de mezclar datos:
Para mezclar datos con TensorFlow.js, primero debemos convertir nuestros datos en un tf.data.Dataset
.
Podemos hacer esto usando los métodos tf.data.array()
o tf.data.tensor()
:
// Convert an array into a dataset
const dataset = tf.data.array([1, 2, 3, 4, 5]);
// Convert a tensor into a dataset
const dataset = tf.data.tensor([1, 2, 3, 4, 5]);
Una vez que tengamos nuestro conjunto de datos, podemos usar tf.data. método shuffle()
para mezclar los datos:
const shuffledDataset = dataset.shuffle();
Para agrupar datos con TensorFlow.js, primero debemos convertir nuestros datos en un tf.data.Dataset
.
Podemos hacer esto usando los métodos tf.data.array()
o tf.data.tensor()
:
// Convert an array into a dataset
const dataset = tf.data.array([1, 2, 3, 4, 5]);
// Convert a tensor into a dataset
const dataset = tf.data.tensor([1, 2, 3, 4, 5]);
Una vez que tengamos nuestro conjunto de datos, podemos usar tf.data. método batch()
para agrupar los datos:
const batchedDataset = dataset.batch(2);
Para mezclar y agrupar datos junto con TensorFlow.js, primero debemos convertir nuestros datos en un tf.data.Dataset
.
Podemos hacer esto usando los métodos tf.data.array()
o tf.data.tensor()
:
// Convert an array into a dataset
const dataset = tf.data.array([1, 2, 3, 4, 5]);
// Convert a tensor into a dataset
const dataset = tf.data.tensor([1, 2, 3, 4, 5]);
Una vez que tengamos nuestro conjunto de datos, podemos usar tf.data. barajar()
y tf.data. Batch()
métodos para mezclar y procesar por lotes los datos:
const shuffledAndBatchedDataset = dataset.shuffle().batch(2);