Qué es el problema del N+1
Se trata de un problema de optimización de consultas a una base de datos.
Imagina que tienes una base de datos con dos tablas:
- Users
- PhoneNumbers
Donde cada usuario puede tener muchos números telefónicos (Relación 1:N).
Ahora, imagina que tienes que mostrar un listado de todos los usuarios junto con sus números de teléfono.
Una forma de resolverlo sería utilizar una consulta tipo:
SELECT * FROM users;
Y luego:
foreach ($users as $user) { $sql = "SELECT * FROM phone_numbers WHERE user_id = {$user->getId()};"; ... }
Lo que sucede aquí es que realizamos una consulta para obtener todos los usuarios y luego, una más por cada uno.
De ahí que el número total de consultas que se realizan es N (Número de usuarios) + 1.
Esto puede representar un gran problema cuando N es grande… especialmente cuando el tiempo que tarda cada consulta es significativo (Por ejemplo porque la base de datos está en un servidor remoto y hay que contar con los tiempos de transferencia de red).
Solución basada en JOIN
Una primera solución sería utilizar un join:
SELECT * FROM users u INNER JOIN phone_numbers p ON p.user_id = u.id;
Aquí el problema es que el resultado tendrá mucha información duplicada (Todos los datos del usuario estarán repetidos en cada fila), lo cual puede traernos inconvenientes con la memoria.
Solución de dos consultas
Una solución más eficiente se basa en la realización de dos consultas.
Los pasos son los siguientes:
- Buscar los objetos principales
- Obtener los Ids de dichos objetos
- Buscar los objetos relacionados para aquellos Ids obtenidos en 2
- Mostrar el resultado combinado
SELECT * FROM user;
$ids = array_map(function(User $u) { return $u->getId(); }, $users ); $phone_numbers = $db->query("SELECT * FROM phone_numbers WHERE user_id IN ('.implode(', ', $ids).')"); foreach ( $users as $user ) { $str = $user->getName() . implode(',', array_filter($phone_numbers, function($p) use ($user) { return $p['user_id'] == $user->getId(); })); }
En esta solución la cantidad de consultas realizadas siempre es fija: 2.
Puede parecer algo más laborioso del lado del PHP, pero ten en cuenta que los tiempos de procesamiento siempre son significativamente inferiores respecto de los de comunicación vía red u otro tipo de operaciones de entrada/salida, con lo cual, vale la pena el esfuerzo extra 😉
- Cómo agregar una página de error 500 en un proyecto PHP - 31/10/2024
- ¿Cuántos contenedoresnecesita tu php? - 28/10/2024
- Cuál es el mejor framework PHP para hacer APIs REST - 25/10/2024