Форум Херсона. Форум Херсонской молодежи, флейм, фотографии Херсона, политика в Херсоне, сетевой форум, сети Херсона


Приветствуем на Форум Херсона. Форум Херсонской молодежи..

На данный момент Вы находитесь на форуме как Гость и имеете очень ограниченные возможности и права. Что бы писать или отвечать в темах, загружать картинки, файлы на форуме Вам нужно зарегистрироваться, что совершенно бесплатно. Регистрация очень быстрая, не откладывайте эту процедуру!

Если возникнут проблемы с регистрацией напишите нам.

Галерея форума Блоги пользователей Список банов
Вернуться   Форум Херсона. Форум Херсонской молодежи. > >
Регистрация СправкаСтатистика Пользователи Календарь Сообщения за день

Программирование Все вопросы по написанию программ

Ответ
 
Опции темы
Старый 10.03.2009, 21:13   #1 (Ссылка на пост)
АптИчески непразрачЕн.
 
Аватар для Absent
Пол:
 
Активность Longevity
0/20 18/20
Today Сообщения
0/5 sssss1815
Адрес: Дома
Благодарил(а): 483
Благодарили 1,159 раз в 423 постах
Галерея: 0
Вес репутации: 30 Absent заслуживает, что бы гордиться собойAbsent заслуживает, что бы гордиться собойAbsent заслуживает, что бы гордиться собойAbsent заслуживает, что бы гордиться собойAbsent заслуживает, что бы гордиться собойAbsent заслуживает, что бы гордиться собойAbsent заслуживает, что бы гордиться собой
Задача каталогизации

Ищю хотябы алгоритм как каталогизировать руцями или парсингом из списка параметров какие либо сущьности.

Пример: есть CSV-шка с данными.
Каждая строка с одинаковым количеством текстовых нормированных параметров.

необходимо на выходе получить дерево с минимальным количеством пустых промежуточных узлов, и максимально короткими путями от корня к конечной записи.
Возможно на выходе получить несколько переплетающихся деревьев (однозначная принадлежность узла одного дерева узлу другого.)
Сабпример:
дерево цветов:
- красный,
-жёлтый
- зеленый
- синий
- марковный.

Дерево сущностей:
- еда
+ мясо
+ фрукты
+ овощи
+ специи
- предметы
+ Пила
+ игрушечная машинка
+ пылесос
+ холодильник
+ кухонный комбайн

вход: Яблоко синее, пылесос морковный, ...
Блин, даж примера не составить........

В гугль посылать только с конкретными ключевиками.
В библиотекарское училище и палату метрологии и каталогизации - ненадо.

Задача скорее из области структуризации неструктурированного контента.....

Мож кто сталкивался?
Подскажите плиз.
__________________
Меньше, чем где-либо, я претендую здесь на полноту, иначе мне пришлось бы повторить массу превосходных житейских правил, преподанных мудрецами разных времен, начиная с Феогниса и псевдо-Соломона и кончая Ларошфуко.
Я буду излагать лишь то, что мне пришло на ум, показалось заслуживающим сообщения, и что, насколько мне не изменяет память, не было еще сказно, или, если и было, то не совсем так, я только подбираю колосья на необозримом, другими до меня сжатом, поле.

Последний раз редактировалось Absent, 10.03.2009 в 21:20.
Absent вне форума  
Ответить с цитированием
Старый 11.03.2009, 08:03   #2 (Ссылка на пост)
тролль-переросток
 
Аватар для Davlat
Пол:
 
Активность Longevity
0/20 18/20
Today Сообщения
0/5 sssss3724
Благодарил(а): 5,234
Благодарили 3,942 раз в 1,397 постах
Галерея: 0
Вес репутации: 60 Davlat скоро в модераторыDavlat скоро в модераторыDavlat скоро в модераторыDavlat скоро в модераторыDavlat скоро в модераторыDavlat скоро в модераторыDavlat скоро в модераторыDavlat скоро в модераторыDavlat скоро в модераторыDavlat скоро в модераторыDavlat скоро в модераторыDavlat скоро в модераторыDavlat скоро в модераторы
Цитата:
Сообщение от Absent Посмотреть сообщение
Яблоко синее, пылесос морковный, ...
Мож кто сталкивался?
Подскажите плиз.
Если точно отсекается по CSV-шке каждый элемент и каждый параметр, то:

делаем массив, в который
while(!EOF)
{
считываем построчно CSV,
ищем в строке вхождения
switch(strcomp(A[i])
case "морковный": считаем в другой массив

}
как-то так. поправьте меня с ноги.
Davlat вне форума  
Ответить с цитированием
Старый 11.03.2009, 12:14   #3 (Ссылка на пост)
АптИчески непразрачЕн.
 
Аватар для Absent
Пол:
 
Активность Longevity
0/20 18/20
Today Сообщения
0/5 sssss1815
Адрес: Дома
Благодарил(а): 483
Благодарили 1,159 раз в 423 постах
Галерея: 0
Вес репутации: 30 Absent заслуживает, что бы гордиться собойAbsent заслуживает, что бы гордиться собойAbsent заслуживает, что бы гордиться собойAbsent заслуживает, что бы гордиться собойAbsent заслуживает, что бы гордиться собойAbsent заслуживает, что бы гордиться собойAbsent заслуживает, что бы гордиться собой
Та оно понятно как файл загружать, переименовывать, парсить, санитайзить, ифнотэрор-обрабатывать....

Вопрос в деревьях.
Надо из признаков сделать ноды дерева.

А по этому алгоритму получится
+ красненькие
+ стерео
+ в Киеве
+ синезелёныйкрасныйшАр

мулька в многоуровневости и вычленении общего и необязательного параметра (к примеру цвет)
__________________
Меньше, чем где-либо, я претендую здесь на полноту, иначе мне пришлось бы повторить массу превосходных житейских правил, преподанных мудрецами разных времен, начиная с Феогниса и псевдо-Соломона и кончая Ларошфуко.
Я буду излагать лишь то, что мне пришло на ум, показалось заслуживающим сообщения, и что, насколько мне не изменяет память, не было еще сказно, или, если и было, то не совсем так, я только подбираю колосья на необозримом, другими до меня сжатом, поле.
Absent вне форума  
Ответить с цитированием
Старый 11.03.2009, 12:17   #4 (Ссылка на пост)
Модератор
Пол:
 
Активность Longevity
0/20 18/20
Today Сообщения
0/5 ssss11242
Благодарил(а): 2,807
Благодарили 19,030 раз в 5,788 постах
Галерея: 15
Вес репутации: 217 zwitter скоро в модераторы
zwitter скоро в модераторыzwitter скоро в модераторыzwitter скоро в модераторыzwitter скоро в модераторыzwitter скоро в модераторыzwitter скоро в модераторыzwitter скоро в модераторыzwitter скоро в модераторыzwitter скоро в модераторыzwitter скоро в модераторыzwitter скоро в модераторыzwitter скоро в модераторыzwitter скоро в модераторыzwitter скоро в модераторыzwitter скоро в модераторыzwitter скоро в модераторыzwitter скоро в модераторыzwitter скоро в модераторыzwitter скоро в модераторы
разбиение продуктов на категории ?

гугли по словам "таксономия", "онтология" и "управляемый словарь" (controlled vocabulary)

крик души ON: *ля почему мне не попадаются такие интересные задачи а сплошь какой-то шлак типа реализации скидок?
zwitter вне форума  
Ответить с цитированием
Эти 2 пользователей сказали Спасибо zwitter за хороший пост:
Absent (11.03.2009), VoVaN (11.03.2009)
Старый 11.03.2009, 13:28   #5 (Ссылка на пост)
АптИчески непразрачЕн.
 
Аватар для Absent
Пол:
 
Активность Longevity
0/20 18/20
Today Сообщения
0/5 sssss1815
Адрес: Дома
Благодарил(а): 483
Благодарили 1,159 раз в 423 постах
Галерея: 0
Вес репутации: 30 Absent заслуживает, что бы гордиться собойAbsent заслуживает, что бы гордиться собойAbsent заслуживает, что бы гордиться собойAbsent заслуживает, что бы гордиться собойAbsent заслуживает, что бы гордиться собойAbsent заслуживает, что бы гордиться собойAbsent заслуживает, что бы гордиться собой
вдУдел.

короче решается эта задача итэративно.
1) собираем инфу о классифицируемых объектах, описываем их важные отличительные параметры.
2) собираем списки иерархических и ортогональных параметров
3) из иерархических строим дерево (ключевой момент. Длинные ветви - плохо), из ортогональных - N-ьурную матрицу.
4) загоняем данные.

5) проверяем спуски, ищя избыточность и неточность, правя руцями.
6) Вероятно доуточняем дерево, или строим новое, дополненное или наоборот, с выброшенными параметрами.

7) постиоянно доуточняем модель данных (руци) с приходом новых признаков обЪектов, и проверяем спуски и ошибки.
Поиск по матрице - простой мультипараметрный фильтр.

3) Подробнее.
Задача - получить дерево с короткими ветвями.
Составляем спектр признаков, сортируем по убыванию.
Составляем спектр сочетанияпар признаков (А отут начинается жЫр).
Составляем массив, загоняя туда доминирующие признаки в паре, как узлы (доминанта определяется исходя из спектрального веса единичного признака). Чем больше отсечём сразу, тем короче останутся ветви...
дда, ресурсоЁмкенькая задачка.

*ушел кноподавить.*
__________________
Меньше, чем где-либо, я претендую здесь на полноту, иначе мне пришлось бы повторить массу превосходных житейских правил, преподанных мудрецами разных времен, начиная с Феогниса и псевдо-Соломона и кончая Ларошфуко.
Я буду излагать лишь то, что мне пришло на ум, показалось заслуживающим сообщения, и что, насколько мне не изменяет память, не было еще сказно, или, если и было, то не совсем так, я только подбираю колосья на необозримом, другими до меня сжатом, поле.

Последний раз редактировалось Absent, 11.03.2009 в 14:14.
Absent вне форума  
Ответить с цитированием
Ответ


Здесь присутствуют: 1 (пользователей - 0 , гостей - 1)
 

Ваши права в разделе
Вы не можете создавать темы
Вы можете отвечать на сообщения
Вы не можете прикреплять файлы
Вы не можете редактировать сообщения

BB коды Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.
Trackbacks are Выкл.
Pingbacks are Выкл.
Refbacks are Выкл.

Похожие темы
Тема Автор Раздел Ответов Последнее сообщение
задача на логику crematorium Флейм 24 03.06.2007 20:05


Время на сервере: 15:16.

Регистрация Справка Пользователи Календарь Сообщения за день

vBulletin 3, Copyright © 2000-2024, Jelsoft Enterprises Ltd.
Русский перевод: zCarot, Vovan & Co