Приветствуем на Форум Херсона. Форум Херсонской молодежи.. На данный момент Вы находитесь на форуме как Гость и имеете очень ограниченные возможности и права. Что бы писать или отвечать в темах, загружать картинки, файлы на форуме Вам нужно зарегистрироваться, что совершенно бесплатно. Регистрация очень быстрая, не откладывайте эту процедуру! Если возникнут проблемы с регистрацией напишите нам. |
|
Программирование Все вопросы по написанию программ |
|
Опции темы |
10.03.2009, 21:13 | #1 (Ссылка на пост) | ||||||||
АптИчески непразрачЕн.
Пол:
Адрес: Дома
Благодарил(а): 483
Благодарили 1,159 раз в 423 постах
Галерея:
0
Вес репутации: 30
|
Задача каталогизации
Ищю хотябы алгоритм как каталогизировать руцями или парсингом из списка параметров какие либо сущьности.
Пример: есть CSV-шка с данными. Каждая строка с одинаковым количеством текстовых нормированных параметров. необходимо на выходе получить дерево с минимальным количеством пустых промежуточных узлов, и максимально короткими путями от корня к конечной записи. Возможно на выходе получить несколько переплетающихся деревьев (однозначная принадлежность узла одного дерева узлу другого.) Сабпример: дерево цветов: - красный, -жёлтый - зеленый - синий - марковный. Дерево сущностей: - еда + мясо + фрукты + овощи + специи - предметы + Пила + игрушечная машинка + пылесос + холодильник + кухонный комбайн вход: Яблоко синее, пылесос морковный, ... Блин, даж примера не составить........ В гугль посылать только с конкретными ключевиками. В библиотекарское училище и палату метрологии и каталогизации - ненадо. Задача скорее из области структуризации неструктурированного контента..... Мож кто сталкивался? Подскажите плиз.
__________________
Меньше, чем где-либо, я претендую здесь на полноту, иначе мне пришлось бы повторить массу превосходных житейских правил, преподанных мудрецами разных времен, начиная с Феогниса и псевдо-Соломона и кончая Ларошфуко. Я буду излагать лишь то, что мне пришло на ум, показалось заслуживающим сообщения, и что, насколько мне не изменяет память, не было еще сказно, или, если и было, то не совсем так, я только подбираю колосья на необозримом, другими до меня сжатом, поле. Последний раз редактировалось Absent, 10.03.2009 в 21:20. |
||||||||
|
11.03.2009, 08:03 | #2 (Ссылка на пост) | |||||||||
тролль-переросток
Пол:
Благодарил(а): 5,234
Благодарили 3,942 раз в 1,397 постах
Галерея:
0
Вес репутации: 60
|
Цитата:
делаем массив, в который while(!EOF) { считываем построчно CSV, ищем в строке вхождения switch(strcomp(A[i]) case "морковный": считаем в другой массив } как-то так. поправьте меня с ноги. |
|||||||||
|
11.03.2009, 12:14 | #3 (Ссылка на пост) | ||||||||
АптИчески непразрачЕн.
Пол:
Адрес: Дома
Благодарил(а): 483
Благодарили 1,159 раз в 423 постах
Галерея:
0
Вес репутации: 30
|
Та оно понятно как файл загружать, переименовывать, парсить, санитайзить, ифнотэрор-обрабатывать....
Вопрос в деревьях. Надо из признаков сделать ноды дерева. А по этому алгоритму получится + красненькие + стерео + в Киеве + синезелёныйкрасныйшАр мулька в многоуровневости и вычленении общего и необязательного параметра (к примеру цвет)
__________________
Меньше, чем где-либо, я претендую здесь на полноту, иначе мне пришлось бы повторить массу превосходных житейских правил, преподанных мудрецами разных времен, начиная с Феогниса и псевдо-Соломона и кончая Ларошфуко. Я буду излагать лишь то, что мне пришло на ум, показалось заслуживающим сообщения, и что, насколько мне не изменяет память, не было еще сказно, или, если и было, то не совсем так, я только подбираю колосья на необозримом, другими до меня сжатом, поле. |
||||||||
|
11.03.2009, 12:17 | #4 (Ссылка на пост) |
Модератор
Пол:
|
разбиение продуктов на категории ?
гугли по словам "таксономия", "онтология" и "управляемый словарь" (controlled vocabulary) крик души ON: *ля почему мне не попадаются такие интересные задачи а сплошь какой-то шлак типа реализации скидок? |
|
11.03.2009, 13:28 | #5 (Ссылка на пост) | ||||||||
АптИчески непразрачЕн.
Пол:
Адрес: Дома
Благодарил(а): 483
Благодарили 1,159 раз в 423 постах
Галерея:
0
Вес репутации: 30
|
вдУдел.
короче решается эта задача итэративно. 1) собираем инфу о классифицируемых объектах, описываем их важные отличительные параметры. 2) собираем списки иерархических и ортогональных параметров 3) из иерархических строим дерево (ключевой момент. Длинные ветви - плохо), из ортогональных - N-ьурную матрицу. 4) загоняем данные. 5) проверяем спуски, ищя избыточность и неточность, правя руцями. 6) Вероятно доуточняем дерево, или строим новое, дополненное или наоборот, с выброшенными параметрами. 7) постиоянно доуточняем модель данных (руци) с приходом новых признаков обЪектов, и проверяем спуски и ошибки. Поиск по матрице - простой мультипараметрный фильтр. 3) Подробнее. Задача - получить дерево с короткими ветвями. Составляем спектр признаков, сортируем по убыванию. Составляем спектр сочетанияпар признаков (А отут начинается жЫр). Составляем массив, загоняя туда доминирующие признаки в паре, как узлы (доминанта определяется исходя из спектрального веса единичного признака). Чем больше отсечём сразу, тем короче останутся ветви... дда, ресурсоЁмкенькая задачка. *ушел кноподавить.*
__________________
Меньше, чем где-либо, я претендую здесь на полноту, иначе мне пришлось бы повторить массу превосходных житейских правил, преподанных мудрецами разных времен, начиная с Феогниса и псевдо-Соломона и кончая Ларошфуко. Я буду излагать лишь то, что мне пришло на ум, показалось заслуживающим сообщения, и что, насколько мне не изменяет память, не было еще сказно, или, если и было, то не совсем так, я только подбираю колосья на необозримом, другими до меня сжатом, поле. Последний раз редактировалось Absent, 11.03.2009 в 14:14. |
||||||||
|
Здесь присутствуют: 1 (пользователей - 0 , гостей - 1) | |
|
|
Похожие темы | ||||
Тема | Автор | Раздел | Ответов | Последнее сообщение |
задача на логику | crematorium | Флейм | 24 | 03.06.2007 20:05 |