Ayuda en la programación, respuestas a preguntas / Mysql / Seleccione un valor de un grupo según el orden de otras columnas: mysql, sql, mariadb

Seleccione un valor de un grupo en función del orden de otras columnas: mysql, sql, mariadb

Supongamos que tengo esta mesa tab (violín disponible).

| g | a | b |     v |
---------------------
| 1 | 3 | 5 |   foo |
| 1 | 4 | 7 |   bar |
| 1 | 2 | 9 |   baz |
| 2 | 1 | 1 |   dog |
| 2 | 5 | 2 |   cat |
| 2 | 5 | 3 | horse |
| 2 | 3 | 8 |   pig |

Estoy agrupando filas por g, y para cada grupo quiero un valor de la columna v. Sin embargo, no quiero alguna valor, pero quiero el valor de la fila con el máximo a, y de todos ellos, el que tiene el máximo b. En otras palabras, mi resultado debería ser

| 1 |   bar |
| 2 | horse |

Solución actual

Conozco una consulta para lograr esto:

SELECT grps.g,
(SELECT v FROM tab
WHERE g = grps.g
ORDER BY a DESC, b DESC
LIMIT 1) AS r
FROM (SELECT DISTINCT g FROM tab) grps

Pregunta

Pero considero esta consulta más bien feo. Principalmente porque usa un subconsulta dependiente, que se siente como un verdadero asesino de rendimiento. Entonces me pregunto si existe una solución más fácil a este problema.

Respuestas esperadas

La respuesta más probable que espero a esta pregunta.sería algún tipo de complemento o parche para MySQL (o MariaDB) que proporciona una función para esto. Pero también daré la bienvenida a otras inspiraciones útiles. Cualquier cosa que funcione sin una subconsulta dependiente calificaría como una respuesta.

Si su solución solo funciona para una sola columna de pedido, es decir, no podría distinguir entre cat y horse, siéntase libre de sugerir esa respuesta tan bien como espero que siga siendo útil para la mayoría de los casos de uso. Por ejemplo, 100*a+b sería una forma probable de ordenar los datos anteriores por ambas columnas sin dejar de usar una sola expresión.

Tengo algunas soluciones bastante complicadas en mente, y podría agregarlas después de un tiempo, pero primero miraré y veré si aparecen algunas nuevas y agradables.

Resultados de referencia

Como es bastante difícil comparar los distintosrespuestas con sólo mirarlas, he ejecutado algunos puntos de referencia en ellas. Esto se ejecutó en mi propio escritorio, usando MySQL 5.1. Los números no se compararán con ningún otro sistema, solo entre sí. Probablemente debería hacer sus propias pruebas con sus datos de la vida real si el rendimiento es crucial para su aplicación. Cuando lleguen nuevas respuestas, podría agregarlas a mi script y volver a ejecutar todas las pruebas.

100,000 artículos, 1,000 grupos para elegir, InnoDb:
1. 0.166s para MvG (de la pregunta)
2. 0.520s para RichardTheKiwi
3. 2.199s para xdazz
4. 19.24s para Demócratas (subconsultas secuenciales)
5. 48.72s para acatt
100.000 elementos, 50.000 grupos para elegir, InnoDb:
1. 0.356s para xdazz
2. 0.640s para RichardTheKiwi
3. 0.764s para MvG (de la pregunta)
4. 51.50s para acatt
5. demasiado largo para Demócratas (subconsultas secuenciales)
100.000 elementos, 100 grupos para elegir, InnoDb:
1. 0.163s para MvG (de la pregunta)
2. 0.523s para RichardTheKiwi
3. 2.072s para Demócratas (subconsultas secuenciales)
4. 17.78s para xdazz
5. 49.85s para acatt

Así que parece que mi propia solución hasta ahora no es todoasí de malo, incluso con la subconsulta dependiente. Sorprendentemente, la solución de acatt, que también usa una subconsulta dependiente y que, por lo tanto, habría considerado aproximadamente lo mismo, funciona mucho peor. Probablemente algo con lo que el optimizador de MySQL "no puede hacer frente. La solución que propuso RichardTheKiwi también parece tener un buen rendimiento general. Las otras dos soluciones dependen en gran medida de la estructura de los datos. Con muchos grupos de grupos pequeños, el enfoque xdazz" supera a todos los demás, mientras que la solución de los demócratas funciona mejor (aunque no excepcionalmente bien) para unos pocos grupos grandes.

Respuestas

4 para la respuesta № 1

SELECT g, a, b, v
FROM (
SELECT *,
@rn := IF(g = @g, @rn + 1, 1) rn,
@g := g
FROM (select @g := null, @rn := 0) x,
tab
ORDER BY g, a desc, b desc, v
) X
WHERE rn = 1;

Pase único. Todas las otras soluciones me parecen O (n ^ 2).

5 para la respuesta № 2

De esta forma no se utilizan subconsultas.

SELECT t1.g, t1.v
FROM tab t1
LEFT JOIN tab t2 ON t1.g = t2.g AND (t1.a < t2.a OR (t1.a = t2.a AND t1.b < t2.b))
WHERE t2.g IS NULL

Explicación:</ strong>

El LEFT JOIN funciona sobre la base de que cuando t1.a está en su valor máximo, no hay s2.a con un valor mayor y los valores de las filas de s2 serán NULL.
1 para la respuesta № 3
Esto se puede resolver mediante una consulta correlacionada:

SELECT g, v FROM tab t WHERE NOT EXISTS ( SELECT 1 FROM tab WHERE g = t.g AND a > t.a OR (a = t.a AND b > t.b) )
1 para la respuesta № 4
Muchos RDBMS tienen construcciones que se adaptan particularmente a este problema. MySQL no es uno de ellos.

Esto lo lleva a tres enfoques básicos.

Verifique cada registro para ver si es el que desea, utilizando EXISTS y una subconsulta correlacionada en una cláusula EXISTS. (La respuesta de @acatt, pero entiendo que MySQL no siempre optimiza esto muy bien. Asegúrese de tener un índice compuesto en (g,a,b) antes de asumir que MySQL no hará esto muy bien).

Haga un producto medio cartesiano para completar el mismo cheque. Cualquier registro que no se una es un registro de destino. Cuando cada grupo ("g") es grande, esto puede degradar rápidamente el rendimiento (Si hay 10 registros para cada valor único de g, esto producirá ~ 50 registros y descartará 49. Para un tamaño de grupo de 100, producirá ~ 5000 registros y descartará 4999), pero es ideal para grupos pequeños. (La respuesta de @xdazz.)

O use múltiples subconsultas para determinar el MAX (a) y luego el MAX (b) ...

Varias subconsultas secuenciales ...

SELECT yourTable.* FROM (SELECT g, MAX(a) AS a FROM yourTable GROUP BY g ) AS searchA INNER JOIN (SELECT g, a, MAX(b) AS b FROM yourTable GROUP BY g, a) AS searchB ON searchA.g = searchB.g AND searchA.a = searchB.a INNER JOIN yourTable ON yourTable.g = searchB.g AND yourTable.a = searchB.a AND yourTable.b = searchB.b

Dependiendo de cómo MySQL optimice la segunda subconsulta, esta puede o no ser más eficiente que las otras opciones. Sin embargo, es el más largo (y potencialmente menos mantenible) código para la tarea dada.

Suponiendo un índice compuesto en los tres campos de búsqueda (g, a, b), Supongo que es mejor para grupos grandes de g. Pero eso debería probarse.

Para grupos pequeños de g, Iría con la respuesta de @xdazz.

EDITAR

También hay un enfoque de fuerza bruta.

Cree una tabla idéntica, pero con una columna AUTO_INCREMENT como identificación.

Inserte su tabla en este clon, ordenado por g, a, b.

Las identificaciones se pueden encontrar con SELECT g, MAX(id).

Este resultado se puede utilizar para buscar el v valores que necesita.

Es poco probable que este sea el mejor enfoque. Si es así, es efectivamente una condimentación de la capacidad del optimizador de MySQL para lidiar con este tipo de problema.

Dicho esto, cada motor tiene sus puntos débiles. Así que, personalmente, lo intento todo hasta que pensar Entiendo cómo se está comportando el RDBMS y puedo hacer mi elección :)

EDITAR

Ejemplo usando ROW_NUMBER(). (Oracle, SQL Server, PostGreSQL, etc.)

SELECT * FROM ( SELECT ROW_NUMBER() OVER (PARTITION BY g ORDER BY a DESC, b DESC) AS sequence_id, * FROM yourTable ) AS data WHERE sequence_id = 1

preguntas relacionadas

Dónde instalar los paquetes mariadb-devel y python34-mysql-debug para python en un entorno de servidor de aplicaciones de servidor / db dividido - python, mysql, mariadb
phpinfo () muestra MySQL, PMA muestra MariaDB - php, mysql, phpmyadmin, mariadb
Utilice un ORDER BY con una consulta que ya tenga GROUP BY - php, mysql, sql, group-by, sql-order-by
MariaDb vía Puppet y Vagrant - mysql, virtualbox, vagrant, marioneta, mariadb
¿Cómo puedo cambiar MySQL a MariaDb en la instalación de LAMP - mysql, mariadb
Migrando de MySQL a MariaDB y viceversa - mysql, mariadb
El límite con el operador no está funcionando correctamente MySql - mysql, limit
¿Qué versión de mariadb puede reemplazar a mysql 5.7? [cerrado] - mysql, mariadb
¿Es posible usar mysql5.5 y mariaDB 10.0 en la misma máquina? - mysql, mariadb, apt-get
Ejecute mysql sin sudo - mysql, mariadb, sudo
Cómo puedo eliminar mariadb de centos linux de forma segura? - mysql, linux, centos, mariadb
GROUP BY no funciona con una subconsulta - mysql, mariadb
Debian 9 cómo instalar MariaDB sin el nombre de MySQL? - mysql, debian, mariadb, debian-stretch
Obtención de un error de sintaxis para la variable después de tener cuenta en MySQL - mysql, sql
TRUNCATE TABLE Se bloquea en MariaDB - mysql, truncado, mariadb
¿Leer la documentación de mysql es una buena forma de aprender conceptos de mariadb? - mysql, mariadb
MariaDB no puede deshacerse de la contraseña en blanco - mariadb, ubuntu-16.04
Literales de cadena de escape en REGEXP con MySQL - java, mysql, mariadb
¿Qué cambios se deben hacer a una aplicación web de MySQL a MariaDB? [cerrado] - java, mysql, java-ee, mariadb
¿Cómo obtener la conexión MariaDB usando java? - java, conexión a la base de datos, mariadb

Las mejores preguntas

Cómo convertir byte [] a código de barras en ZXing - zxing

ZXing truncando bytes negativos - zxing

zxing devuelve la posición incorrecta de CODE_39-Código de barras - zxing

Rejilla Zurb Foundation 5 - Control no de columnas en pequeño - med - large - zurb-foundation

Sitio web receptivo Problema de formulario desplegable - zurb-foundation, zurb-foundation-5

Con Foundation for Apps, ¿cómo incluyo una directiva personalizada y la uso? - zurb-fundación

Detecta si se ha ejecutado la función Foundation - zurb-foundation

Javascript no funciona? Cuestión de acordeón de la Fundación Zurb - zurb-foundation

Forzar el diseño de la pantalla con Zurb-Foundation - zurb-foundation

Cómo mostrar expresiones dentro de Foundation Zurb - zurb-foundation, zurb-foundation-6

instalar el correo electrónico de la nueva fundación se produjo un error - zurb-foundation, email-templates

¿Pestañas verticales como en la fundación documenta el sitio web con la fundación zurb? - zurb-fundación

reorganice el orden de las columnas div según la tableta o el teléfono del dispositivo. zurb foundation 4 - zurb-foundation

Instalar una versión anterior de Foundation - zurb-foundation

¿Cambiar el botón de cerrar alerta de la fundación para evitar que se elimine del dom? - zurb-fundación