Cómo eliminar duplicados en Google Sheets

Eliminar filas duplicadas en Google Sheets (1)

Una de las labores de limpieza más importantes que debemos hacer a nuestras bases o tablas es la eliminación de los duplicados

En este artículo vemos diferentes métodos para eliminar filas duplicadas de una lista o tabla en Google Sheets.

¿Por qué necesitamos metodologías complejas para eliminar duplicados?

Si manejan generalmente bases muy pequeñas o muy controladas, puede que no se encuentren con este problema. O si se lo han encontrado, es muy fácil solucionarlo, simplemente identificándolos y eliminándolos uno por uno de manera manual.

Pero cuando manejamos cientos o miles de registros, esta labor nos puede tardar minutos e incluso horas.

Por eso, hoy les voy a presentar varios métodos de variable complejidad para eliminar registros o filas duplicadas en Google Sheets

Método 1 (El clásico): Ordenarlos, identificarlos y eliminarlos

Este es un método muy confiable y flexible pero algo complejo (muchos pasos). Lo interesante del mismo es que sirve no solo para duplicados, sino para otros casos, dependiendo de la complejidad de la fórmula.

El método consiste en ordenar los datos alfabéticamente (de forma ascendente o descendente, no importa), después, en una columna auxiliar es fácil mediante una fórmula identificar los que estén repetidos (es decir los que sean iguales a la celda superior). Estos se pueden identificar con una palabra clave (como “repetido”). Luego se elimina la fórmula (copiando y pegando como valores). Por último se ordena alfabéticamente la columna auxiliar y se eliminan todos los identificados con “repetido”.

¿Suena complicado? Dividamos el proceso en pasos:

  1. Ordenar los datos (de forma ascendente o descendente) de alguna de las siguientes maneras:
    1. Mediante filtros
    2. Ordenando la columna
    3. Mediante el comando “ordenar intervalo”
  2. Crear una columna auxiliar
  3. En la segunda fila de la columna, escribimos la siguiente fórmula:
    1. =SI(A1=A2;”Repetido”;”Único”)
  4. Arrastramos la columna desde el cuadrado de la esquina superior izquierda (o damos doble clic sobre el mismo).
  5. Copiamos la columna de la fórmula y la pegamos como valores
  6. Ordenamos ahora los datos, pero por la segunda columna, para que todo lo “Repetido” quede seguido.
  7. Seleccionamos todo lo marcado como “Repetido”
  8. Eliminamos estas filas (o celdas).
    1. Seleccionamos las filas (desde el borde izquierdo)
    2. Damos Clic derecho
    3. En el menú contextual buscamos la opción “Eliminar filas”

Método 2: La fórmula UNIQUE (exclusiva de Sheets)

El método anterior no es muy eficiente sobre todo cuando tenemos cientos o miles de filas

Pero es importante conocerlo porque tiene la particularidad que funciona con cualquier hoja de cálculo (Sea Excel o Sheets), y como les decía antes, le pueden incluir la complejidad que ustedes deseen, simplemente modificando la fórmula).

Aquí les dejo un tutorial para ver más métodos de identificar los duplicados antes de eliminarlos

En cambio las siguientes metodologías son mucho más sencillas, pero son exclusivas de Google Sheets.

La primera es usar esa magnífica fórmula llamada UNIQUE (Mismo nombre en español o inglés)

UNIQUE toma cualquier lista y trae los valores únicos, sin repetidos, es decir justo lo que queremos.

La redactamos de la siguiente manera:

=UNIQUE(A2:A18)

Lo interesante de UNIQUE es que tambien funciona para filas enteras, es decir que no solo en valores individuales, sino que si quiero ver eliminar filas con 2, 5 o 10 campos, cuando todos los campos sean iguales, lo puedo hacer.

El otro lado de la moneda, es que si quiero eliminar toda la fila basado en un solo valor o llave repetido, UNIQUE no me va a funcionar

A continuación el sencillo paso a paso del método UNIQUE

  1. En una celda cualquiera (que tenga espacio debajo), escribimos la siguiente fórmula:
    1. =UNIQUE(Rango)
    2. Rango puede ser una referencia como A1:F1000, o un Intervalo con nombre, u otra formula.

Este método también es muy útil cuando la eliminación de los duplicados tenemos que hacerla en un duplicado de la base original. Es decir que no podemos modificar la base original.

Eliminar las filas duplicadas con la opción “Quitar duplicados”

Si por el contrario, si pueden eliminar los duplicados porque le hacen “limpieza” periódica a su base, Google Sheets creó un método con un solo botón. Este se encuentra en la opción “Datos” > “Borrado de Datos”>”Quitar duplicados”.

Esto nos traerá el siguiente cuadro

Este método nos brinda ciertas opciones para nuestras depuraciones, entre otras seleccionar si el intervalo tiene encabezados o no

Pero lo más interesante y útil es que yo puedo escoger que columnas incluir en mi análisis

Veamos el siguiente ejemplo para entender mejor esto

Si ven la imagen con detenimiento se van a dar cuenta que la fila 2 y la fila 4 tienen el mismo ID pero diferente nombre

Dependiendo de mi situación puedo querer una de dos opciones:

  1. Eliminar los duplicados del ID (Columna A); o
  2. Eliminar los duplicados tanto de ID como de nombre (Columna A y Columna B)

Volviendo a nuestro ejemplo, si queremos la primera opción escogeremos solo la Coluna A

Lo que eliminará la fila 4

Si, por el contrario queremos la opción 2, dejariamos seleccionadas todas las columnas, lo que, en nuestro ejemplo no elimnaria nada

Conclusión

Como pudieron ver, eliminar duplicados es una tarea sencilla, y tenemos varios métodos para hacerla. Todo depende de que tipo de duplicados tenemos (si de lista, o de fila) y si queremos eliminarlos inmediatamente o primero identificarlos

Quedo pendiente de sus sugerencias o de casos específicos que no estén cubiertos en el artículo

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

Pin It on Pinterest

Share This