Создание дерева на основе глубины из иерархических данных в MySQL (без CTE)

Привет Уже много дней я работаю над этой проблемой в MySQL, однако я не могу понять это. У кого-нибудь из вас есть предложения?

По сути, у меня есть таблица категорий с такими доменами, как: id, name (имя категории) и parent (идентификатор родителя категории).

Пример данных:

1  Fruit        0
2  Apple        1
3  pear         1
4  FujiApple    2
5  AusApple     2
6  SydneyAPPLE  5
....

Есть много уровней, возможно, более 3 уровней. Я хочу создать SQL-запрос, который группирует данные в соответствии с иерархией: родитель> ребенок> внук> и т. д.

Он должен вывести древовидную структуру следующим образом:

1 Fruit 0
 ^ 2 Apple 1
   ^ 4 FujiApple 2
   - 5 AusApple 2
     ^ 6 SydneyApple 5
 - 3 pear 1

Могу ли я сделать это с помощью одного SQL-запроса? Альтернатива, которую я пробовал и работает, заключается в следующем:

SELECT * FROM category WHERE parent=0

После этого я снова перебираю данные и выбираю строки, где parent=id. Это кажется плохим решением. Поскольку это mySQL, нельзя использовать CTE.


person bluedream    schedule 13.03.2011    source источник
comment
все еще читаю и понимаю все решения, не уверен, какое из них выбрать.   -  person bluedream    schedule 14.03.2011
comment
Жаль, что вы не используете MSSQL — функция HierachyId решает эту проблему и работает очень быстро.   -  person Kirk Broadhurst    schedule 14.03.2011
comment
stackoverflow.com/questions/4048151/   -  person orangepips    schedule 14.03.2011
comment
добавил дополнительную информацию к моему ответу :)   -  person Jon Black    schedule 15.03.2011


Ответы (4)


Вы можете сделать это одним вызовом из php в mysql, если используете хранимую процедуру:

Примеры вызовов

mysql> call category_hier(1);

+--------+---------------+---------------+----------------------+-------+
| cat_id | category_name | parent_cat_id | parent_category_name | depth |
+--------+---------------+---------------+----------------------+-------+
|      1 | Location      |          NULL | NULL                 |     0 |
|      3 | USA           |             1 | Location             |     1 |
|      4 | Illinois      |             3 | USA                  |     2 |
|      5 | Chicago       |             3 | USA                  |     2 |
+--------+---------------+---------------+----------------------+-------+
4 rows in set (0.00 sec)


$sql = sprintf("call category_hier(%d)", $id);

Надеюсь это поможет :)

Полный сценарий

Структура тестовой таблицы:

drop table if exists categories;
create table categories
(
cat_id smallint unsigned not null auto_increment primary key,
name varchar(255) not null,
parent_cat_id smallint unsigned null,
key (parent_cat_id)
)
engine = innodb;

Данные испытаний:

insert into categories (name, parent_cat_id) values
('Location',null),
   ('USA',1), 
      ('Illinois',2), 
      ('Chicago',2),  
('Color',null), 
   ('Black',3), 
   ('Red',3);

Процедура:

drop procedure if exists category_hier;

delimiter #

create procedure category_hier
(
in p_cat_id smallint unsigned
)
begin

declare v_done tinyint unsigned default 0;
declare v_depth smallint unsigned default 0;

create temporary table hier(
 parent_cat_id smallint unsigned, 
 cat_id smallint unsigned, 
 depth smallint unsigned default 0
)engine = memory;

insert into hier select parent_cat_id, cat_id, v_depth from categories where cat_id = p_cat_id;

/* http://dev.mysql.com/doc/refman/5.0/en/temporary-table-problems.html */

create temporary table tmp engine=memory select * from hier;

while not v_done do

    if exists( select 1 from categories p inner join hier on p.parent_cat_id = hier.cat_id and hier.depth = v_depth) then

        insert into hier 
            select p.parent_cat_id, p.cat_id, v_depth + 1 from categories p 
            inner join tmp on p.parent_cat_id = tmp.cat_id and tmp.depth = v_depth;

        set v_depth = v_depth + 1;          

        truncate table tmp;
        insert into tmp select * from hier where depth = v_depth;

    else
        set v_done = 1;
    end if;

end while;

select 
 p.cat_id,
 p.name as category_name,
 b.cat_id as parent_cat_id,
 b.name as parent_category_name,
 hier.depth
from 
 hier
inner join categories p on hier.cat_id = p.cat_id
left outer join categories b on hier.parent_cat_id = b.cat_id
order by
 hier.depth, hier.cat_id;

drop temporary table if exists hier;
drop temporary table if exists tmp;

end #

Тестовые прогоны:

delimiter ;

call category_hier(1);

call category_hier(2);

Некоторое тестирование производительности с использованием данных геопланет Yahoo.

drop table if exists geoplanet_places;
create table geoplanet_places
(
woe_id int unsigned not null,
iso_code  varchar(3) not null,
name varchar(255) not null,
lang varchar(8) not null,
place_type varchar(32) not null,
parent_woe_id int unsigned not null,
primary key (woe_id),
key (parent_woe_id)
)
engine=innodb;

mysql> select count(*) from geoplanet_places;
+----------+
| count(*) |
+----------+
|  5653967 |
+----------+

так что это 5,6 миллиона строк (мест) в таблице, давайте посмотрим, как реализация/хранимая процедура списка смежности, вызываемая из php, обрабатывает это.

     1 records fetched with max depth 0 in 0.001921 secs
   250 records fetched with max depth 1 in 0.004883 secs
   515 records fetched with max depth 1 in 0.006552 secs
   822 records fetched with max depth 1 in 0.009568 secs
   918 records fetched with max depth 1 in 0.009689 secs
  1346 records fetched with max depth 1 in 0.040453 secs
  5901 records fetched with max depth 2 in 0.219246 secs
  6817 records fetched with max depth 1 in 0.152841 secs
  8621 records fetched with max depth 3 in 0.096665 secs
 18098 records fetched with max depth 3 in 0.580223 secs
238007 records fetched with max depth 4 in 2.003213 secs

В целом я очень доволен этими холодными средами выполнения, так как я бы даже не начал рассматривать возможность возврата десятков тысяч строк данных на мой внешний интерфейс, а скорее построил бы дерево, динамически извлекая только несколько уровней за вызов. Да, и на всякий случай, если вы подумали, что innodb медленнее, чем myisam - протестированная мной реализация myisam была вдвое медленнее по всем параметрам.

Больше материала здесь: http://pastie.org/1672733

Надеюсь это поможет :)

person Jon Black    schedule 13.03.2011
comment
Я боюсь, что этот метод будет иметь серьезные проблемы с производительностью. - person CyberDude; 13.03.2011
comment
я пробую этот метод, пишу свой собственный, тогда, возможно, я проверю время обработки - person bluedream; 14.03.2011
comment
Вы можете провести тестирование производительности и стресс-тестирование с данными Yahoo GeoPlanet, которые можно найти здесь: developer.yahoo.com/ гео/геопланета/данные - person Jon Black; 15.03.2011
comment
выглядит хорошо, но мне понадобится вечность, чтобы переварить это .. спасибо в любом случае .. проголосовал - person slier; 22.01.2013
comment
@slier - рад помочь вам, если потребуется :) - person Jon Black; 22.01.2013
comment
Большое спасибо! Мне это помогло. - person Maxim Eliseev; 18.04.2013
comment
Классное решение. Я немного изменил его, чтобы поддерживать создание полного пути для имени и принимать параметр NULL id для печати ВСЕХ родителей и их детей. Код находится по адресу gist.github.com/jdmullin/9377818. - person Jeremy Mullin; 06.03.2014
comment
Очень полезно и относительно легко изменить в соответствии с моими требованиями - спасибо @JonBlack :) - person Professor Abronsius; 12.11.2015
comment
К вашему сведению: если кто-то пытается поместить это в PHPMyAdmin на вкладке «подпрограммы», вам нужно настроить переменную самостоятельно и удалить все из процедуры до строки «начало». Тогда он должен работать. Если это не так, скопируйте и вставьте SQL для процедуры и запустите на вкладке SQL. - person Chud37; 13.12.2018
comment
@JonBlack Извините, что беспокою вас - когда я запускаю эту процедуру (или процедуру), она работает, но когда я запускаю ее во второй раз, я получаю Undefined index: ORDER BY. Данные по-прежнему отображаются, но отображается сообщение На сервере обнаружены некоторые ошибки. Я использую PhpMyAdmin, что посоветуете? - person Chud37; 13.12.2018


Вы не можете добиться этого с помощью одного запроса. Ваша иерархическая модель данных в этом случае неэффективна. Я предлагаю вам попробовать два других способа хранения иерархических данных в базе данных: модель MPTT или модель «происхождения». Использование любой из этих моделей позволяет вам сделать нужный выбор за один раз.

Вот статья с более подробной информацией: http://articles.sitepoint.com/article/hierarchical-data-database

person CyberDude    schedule 13.03.2011
comment
Вот описание модели происхождения. - person Ted Hopp; 13.03.2011
comment
Почему вы удалили тег MySQL? - person Martin Smith; 14.03.2011
comment
Это не специфично для MySQL. Это общая тема SQL. - person CyberDude; 14.03.2011
comment
@CyberDude - Но если бы, например, OP находилась на SQL Server, этого можно было бы добиться с помощью рекурсивного CTE. Кто-то потратил время на предоставление такого ответа только для того, чтобы удалить его, когда узнал, что ОП находится в MySQL. - person Martin Smith; 14.03.2011
comment
@Martin: на самом деле все другие основные СУБД поддерживают рекурсивный CTE, кроме MySQL - person a_horse_with_no_name; 14.03.2011

Линейный способ:

Я использую уродливую функцию для создания дерева в простом строковом поле.

/              topic title
/001           message 1
/002           message 2
/002/001       reply to message 2
/002/001/001/  reply to reply
/003           message 3
etc...

таблицу можно использовать для выбора всех строк в порядке дерева с помощью простого SQL-запроса:

select * from morum_messages where m_topic=1234 order by m_linear asc

INSERT просто выбирает родительский линейный (и дочерний) и вычисляет строку по мере необходимости.

select M_LINEAR FROM forum_messages WHERE m_topic = 1234 and M_LINEAR LIKE '{0}/___' ORDER BY M_LINEAR DESC limit 0,1  
/* {0} - m_linear of the parent message*/

DELETE просто удалить сообщение или линейно удалить все ответы родительского сообщения.

person Moshe L    schedule 04.05.2012