83
КОНЦЕПЦИЯ ПОСТРОЕНИЯ НА БАЗЕ НЕЙРОСЕМАНТИЧЕСКОГО ПОДХОДА (ПРИГЛАШЕНИЕ К СОТРУДНИЧЕСТВУ) Бодякин В.И. Институт проблем управления РАН им. В.А. Трапезникова, Москва E-mail: body @ ipu . ru , http://www. informograd . narod . ru , служ.тел.:334-92-39

КОНЦЕПЦИЯ ПОСТРОЕНИЯ НА БАЗЕ НЕЙРОСЕМАНТИЧЕСКОГО ПОДХОДА (ПРИГЛАШЕНИЕ К СОТРУДНИЧЕСТВУ)

Embed Size (px)

DESCRIPTION

ИСКУССТВЕННОГО РАЗУМА. КОНЦЕПЦИЯ ПОСТРОЕНИЯ НА БАЗЕ НЕЙРОСЕМАНТИЧЕСКОГО ПОДХОДА (ПРИГЛАШЕНИЕ К СОТРУДНИЧЕСТВУ). Бодякин В.И. Институт проблем управления РАН им. В.А. Трапезникова, Москва E-mail: body @ ipu . ru , http://www. informograd . narod . ru , служ.тел.:334-92-39. - PowerPoint PPT Presentation

Citation preview

КОНЦЕПЦИЯ ПОСТРОЕНИЯ

НА БАЗЕ НЕЙРОСЕМАНТИЧЕСКОГО ПОДХОДА

(ПРИГЛАШЕНИЕ К СОТРУДНИЧЕСТВУ)

Бодякин В.И. Институт проблем управления РАН

им. В.А. Трапезникова, Москва

E-mail: [email protected] , http://www.informograd.

narod.ru , служ.тел.:334-92-39

2

План обсужденияПостановка задачи. Проблемы 2030 годаН е й р о с е м а н т и к а

- Предметная область Информационный канал Информационная система- Форма представления информации- Автосруктуризация- Нейросемантические структуры (НСС)- Сигнал – Информация – Знание- Адаптивные регуляторы на базе НСС- Текстовая энтропия

Решение. Проекты: - Искусственный разум - Информоград - Восхождение разума

3

Постановка задачи

Проблемы 2030 года• Тенденции уменьшения ресурсоемкости

информационной техники и прогноз • Глобальные эволюционные этапы

лидирующей формы высокоорганизованной материи

• Модель "текстовая жизнь" • Естественная эволюция, - это ряд

аттракторов • Темпы и масштабы эволюции• Эволюция технической цивилизации

4

Тенденции уменьшения ресурсоемкости (f(гp*см3*сек*чел))

информационной техники (на 10 000 оп./с)

1020

1018

1016

1014

1012

1010

108

106

104

102

1

10-2

10-4

10-6

1940-1950г.

1960 1970 1980 1990 2000г. 2010 2020 2030г.

Эволюционные этапы вычислительной техники

Ресурс f(m*v*t) (гр.* см3* сек* чел. ~ (рубли))

MARK-1

М-4

М-220

ЕС-ЭВМ, ЕС-1060

РС Р-4

В пересчете на 10 000 оп./с

РС-286

ЭНИАК

Техноло- гический

предел

5

Глобальные эволюционные этапы лидирующей формы

высокоорганизованной материи

1010

109

108

107

106

105

104

103

102

10

1

0.1

1 2 3 4 5 6 7 8 9 10 11 12

Эволюционные этапы № лидирующей формы высокоорганизованной материи

Длитель-ность этапов в годах

Рождение Вселенной

Возникновение жизни на Земле

Первые позвоночные

Первые человекообразные

Первые люди

Огненные прототехнологии

Собирательство, охота

Земледелие, скотоводство

Индустриальная фаза

Информационная фаза

Ноосфера

Фазовый переход

1970 г.

2030 г.

Этап биоэволюции

Этап социально-индустриальной эволюции

Этап физической эволюции материи

Этап духовной эволюции 2027 г.

Прогноз

10 : 1

6

Зарождение и механизмы направленности эволюции простейших информационных систем (ИС). ("текстовая жизнь").

bcc z cccc z cccdd z cdddddd z … zzz…z bcdd z bddeed z … a bb z … bcdee z … cddb z … ccb z cccc z cccdd z … zzzzzzzzzzzzzzzz…z

ааааааааааааааа

А = {a,b,c,d,…,w,x,y - аналоги химических элементов и z - как аналог пространства}. ( a>b>c>d>… >w>x>y>z ≈ 0 )

ДНК человека, число вариантов = А L ; A=4, L= 10 9 P= 4 -1000 000

000

"Быть иль не быть, вот в чем вопрос?" A=256, L= 36, P=10-80

случайн. A=256, L=4 («слоги»=103 ) 2564 =1010 (-7) «слоги»4 = «слова»=105; 103*4=1012 (-7) -46 !!! «слова»4 = «лексемы»=107; 105*4=1020 (-13) случайн. «лексемы»4=«фразы» =109; 107*4=1028 (-19) !!!!!!!!! P=10-34 иерарх.

7

Энерго-сырьевой потенциал эволюции простейших информационных систем (ИС). ("первые аттракторы").

. .

. 1

2

3

L

ac ab

a b c . . .

.

.

.

ba

b . .

b c

b c

aa

a .

b

c

a

ca cb bb

cc bc

AL

L

1-й аттрактор ИС – «Рецепторный»

L=1 A; L=2 A2 ; L=3 A3 ; …

В

в

о

д

В ы в о д

П а м я т ь

Управление и обработка

Самокопиро- вание ИС

ИС

Воз-действие

Вещество

Энергия

8

Процесс естественной эволюции ИС представляет ряд аттракторов с экспоненциальными характеристиками

Первый из которых "рецепторный" – линейные затраты (x) на расширение диапазона рецепторов ИС дают приращение эволюционного ресурса как Ax, где А – алфавит рецепторов, х – длины образов.

Второй эволюционный аттрактор ИС – "ассоциативный", заключается в переводе линейной формы памяти ИС в иерархически-сетевую.

Третий аттрактор ИС – "интеллектуальный". Он позволяет сводить воспринимаемые семантические переменные текстов к константам их грамматических структур [4]. Конечное множество грамматических структур покрывает большую часть информационного потока любой среды. Четвертый эволюционный аттрактор ИС – "знание" когда все типы грамматических конструкций ИС по переработке текста сводятся к 4 конструкциям над грамматическими конструкциями ИС ("Homo-sapiens").

Пятый эволюционный аттрактор ИС – "социальный", законы А.А.Богданова о сверхаддитивности сложения усилий субъектов.

Шестой аттрактор – "Восхождение разума", интеграция всех ИС независимо от их начальной природы (биологические, искусственные, …), приводит к бесконечному росту эффективности Разума в "понимании " среды. .

9

Темпы и масштабы эволюции

10 : 1

Н а п р а в л е н н о с т ь э в о л ю ц и и Р о с т с ф е р ы в л и я н и я

километры

высшее животные

тысячи

километров

Разум, человек

Солнечная система,

Вселенная

Сверхразум, Ноосфера

метры

высшее растения

мили- метры

простейшие

Рождение Вселенной

Возникновение жизни на земле

Первые позвоночные

Первые человекообразные

Первые люди Цивилизация

Десятки миллиардов лет

Миллиарды лет

Сотни миллионов лет

Десятки миллионов лет

Миллионы лет

Сотни тысяч лет

t Э в о л ю ц и я ф о р м

Эпоха прото-

технологий

Охота, скотоводство

Аграрная фаза Индустриальная фаза

Информационная фаза

Ноосфера Фазовый переход

Сотни тысяч лет Десятки тысяч лет

Тысячи лет Сотни лет Десятки лет Годы Месяцы

t Э в о л ю ц и я с т р у к т у р

информационнный этап

Энерго-вещественный этап

1: 1000

10

Эволюция технической цивилизации

t

R=f(m,v,t)

0 2000 2030 годы Экстенсивный Интенсивный Неустойчивость, Этапы развития фазовый переход

Знание, Интеллек-туально информа-ционный ресурс

(продукта, изделия, услуги)

Материальная ресурсоемкость

Одноклеточный социум

Н о о с ф е р а – форма существования социального организма

(Информоград - первый этап)

Информоград

ИРМИ

1967 США-СССР

Первый палеокризис

11

Н е й р о с е м а н т и к а

- Предметная область – Информационный канал – Информационная система

- Форма представления информации

- Автосруктуризация

- Нейросемантические структуры (НСС)

- Сигнал – Информация – Знание

- Адаптивные регуляторы на базе НСС

- Текстовая энтропия

12

Комплекс: "Предметная область (ПО)

Информационный канал (ИК) Информационная система (ИС)"

t

0

ИК

dhdgdgsg ... shlhllb..

L t

ИС

+ -

"Генетич . программа"

F ПО aj ak

ai

m

ak

m

F ПО

ai

aj

Предметная область (ПО)Любую физическую ПО можно рассматривать как некоторую дискретную пространственно-временную область с взаимодействующими объектами-процессами (ai, aj,). При попадании нескольких объектов, в одну и ту же ячейку (область взаимодействия), происходит процессих взаимодействия.

14

Энергетика физического процесса это некоторый инвариант, характеризующий потенциальную глубину причинно-следственного распространения данного физического процесса

Предположим, что скорости распространения разнообразных физических процессов различны.

Мы будем рассматривать только такие ПО, в которых существуют малоэнергетические сопутствующие процессы с большими скоростями распространения, относительно основного физического процесса.

15

Процесс взаимодействия объектов осуществляется в течение нескольких тактов времени t2‑t1.

Результат взаимодействия объектов выражается в изменении величины одного или нескольких параметров W, характеризующих их взаимодействие.

Любой W(t) может быть преобразован в текстовую форму.

многомерный физический процесс <-> текстовая форма

а) б) в) г)

b

tn a

Z ...

W

t1 t

A * * * * * * *

<kzkkzkb>

текстовая форма t2

ln

Wn

16

Будем предполагать, что в любой ПО выполняются:

- принцип причинности (инвариантность процессов во времени и в пространстве), т.е. если si sj, то процесс si всегда вызывает sj;

- принцип локальной однородности (сведение континуума значений параметра к ограниченному числу качественно-различных образов, т.е. (<zzjbaabj>= si) ~ (<zzjbab>= si);

Например, вся температурная шкала разбивается на четыре образа: si= «твердое», sj= «жидкое», sk= «газ», sl= «плазма».

- принцип субъектности, т.е. каждый процесс ПО (si) имеет оценку полезности для

ИС.

17

При взаимодействии объектов (например, {ai*aj}), в соответствии с F(ПО), порождается ЭСЕ - элементарная семантическая единица

(s{ai*aj} = <cade…b>), которая однозначно порождается процессом взаимодействия этих объектов.

Все множество взаимодействий в данной ПО, представляет собой семантическое пространство, как совокупность ЭСЕ.

В качестве примеров ЭСЕ различных ПО можно привести:

взаимодействие элементарных частиц – <ababcw>;

<Привет Петров, как дела? Нормально!> – взаимодействие объектов макроуровневых ПО;

образование двойной звезды из двух астрообъектов – <zzjbaabj>(на гигауровне).

cade…b

a1 a2 … a i … an

a1 a2 …

a j … a n

"d" . . . "тройки"

"пары"

ЭСЕ, порождаемые в ПО, суперпозиционно "сливаются" в непрерывный информационный поток. W

18

Информационный канал (ИК). В ИК происходит процесс формирования информационного ресурса и его транспортировка к ИС. Частота взаимодействия объектов в ПО определяет плотность информационного потока в ИК.

информационная компонента (сигнал)

а) б) в)

abcd abcd zx Е abcd dab cw . . .bcdsdbcddabdedsdadffabcdwzwjh

tn

ИС

ПО

. . . bcdabcddabdzxcwzxdljjkehdlkjhhbhdlkjjjh

tn

ИС

ИР

ПО

ИК

. . . abcd dab d ded deas lklj kjy uuus

. . . dab d lklj deas kjy uuus tn физическая компонента процесса t

ИС

ПО

19

В рамках рассматриваемого комплекса: ПО -- ИК -- ИС, задача ИС заключается в:

t

0

ИК

dhdgdgsg ... shlhllb..

L t

ИС

+ -

"Генетич . программа"

F ПО aj ak

ai

m

1. Воспринимать текстовую форму 2. Хранить информацию3. Преобразовывать (качественно) информацию4. Оценивать информацию5. Выдавать информацию (текстовую форму) 6. Иметь положительный эволюционный потенциал

АВТОСТРУКТУРИЗАЦИЯ НЕПРЕРЫВНОГО

ТЕКСТОВОГО ПОТОКА

. . . . bcdddabdzxcwzxdljkehkjhhbhdlkjjh

ИС

ПО ИК

010101010101001001001110110101010101010101010101010100101010101010101010101010000010101010101001010101010101010101001010100101010101010101010100101010101010101001010100101010101010101010010101010100100110101010101010101010101010101010101010101010101010100110010101010101010101010101010101010100101010101010101010101010010101010101010100110101010101010101001010

ПОЧЕМУ ВСЕ ОРГАНИЗМЫ "ЕДИНОДУШНЫ" В КЛАСТЕРИЗАЦИИ ОКРУЖАЮЩЕГО НАС

МИРА НА ОТДЕЛЬНЫЕ ОБРАЗЫ ?

…0100101…

…0100101…

…1010010… …0100101…

Предметная область

..1010010…

22

Традиционный способ структуризации в системах ИИ

t

Информационный канал

010101010... 01010101..

ПО aj ak

ai

01001 – apll 001111 …

00111001 - . 101010 -

Прог-рамма

ИИ

Програм-мист систем ИИ

Предметная область

Пользователь

Задача:Задача: в в непрерывном потоке ТФ непрерывном потоке ТФ необходимо выделить образы, необходимо выделить образы, соответствующие процессам соответствующие процессам

любойлюбой ПОПО

МАКРИСРИСМАКДУБЛЕН

t01 t02 t03

ПО ИС

АКРИСМКД УБЛЕНД …

РИС ДУБ

МАКЛЕН

Результат:Результат: Минимальный словарь ИС (гомоморфен процессам ПО)

Метод:Метод: построение в ИС множества построение в ИС множества различных различных словарей и выбор словарей и выбор минимальногоминимального (R (Rii))

Инструментарий:Инструментарий: нейросемантические нейросемантические структуры структуры

R1

Rm

Демонстрационный примерДемонстрационный пример(четыре равновероятных процесса формируют непрерывный (четыре равновероятных процесса формируют непрерывный

поток ТФ)поток ТФ)

СМАКРИСРИСМАКДУБЛЕН

ИС

____

"Генетич. программ

а"

Необходимо построить словарь в N образов, полностью покрывающий ТФ. Примем что:Энергетические затраты на обработку одного образа в ИС равна 1Е-.Время обработки символа и образа один такт Т, Энергетические затраты на хранение одного образа в памяти 1/24 Е-.Энергетика каждого прогнозируемого ИС символа равна 1Е+, Усредненный на 12 тактов энергетический баланс ИС = -N(обработка) -1/2N(хранение) + (12-N)(прогнозирование) = (12 - 5/2N)*E

ПО

ДУБ

ЛЕН

РИС

МАК

aj

ai ak

Текстовой поток

Закрашенный поток

Результаты эксперимента Первая структуризация словаря ИС Форма словаря: (наибольший размер образа один символ): <М><А><К><Р><И><С><Л><Е><Н><Д><У><Б>, R(ИС)=12R*(0,5Е-/R) = 6E-, прогнозирование (Т) = 0Т (т.к. у образа только один символ), затраты энергии на распознавание = 12E- контролирование потенциальной энергии ТФ = 0E+. Итог: для односимвольного словаря усредненный

энергетический баланс = 18E- .

Материальная компонента (энергия – Э, в джоулях)

Эволюционный потенциал

ЭП = Э * И

Информационная компонента И (в битах)

Информационно- управляющая

система

Усредненный энергетический баланс ИС назовем

эволюционным потенциалом ИС

Эволюционный потенциал ИСчисленно характеризуетжизнеспособность ИС

26

Вторая структуризация словаря

ИС

а) Минимальная форма словаря: <МА><К><РИ><С><ЛЕ><Н><ДУ><Б>:

R(ИС)=8R =4Е-, прогнозирование = 0,5Т (на образ), затраты энергии на распознавание = 8E-, контролирование потенциальной энергии ТФ = 4E+. Итог а) 4Е- + (0,5Т * 8(образов на ТФ=12) = 4E+) + 8E- = 8E- .

б) Максимальная форма (без полного пересечения): <МА><КЛ><КР><КД><КМ> <ЛЕ>…<БД>:

R(ИС)= 20R=10Е-, прогнозирование = 0,2Т (на образ), затраты энергии на распознавание = 20E-, контролирование потенциальной энергии ТФ = 4E+. Итог б) 10Е- + (0,2Т * 20(образов на ТФ=12) = 4E+) + 20E- = 26E- .

Итоговый лучший эволюционный потенциал = 8E- .

(наибольший размер образа два символа):

27

Третья структуризация словаря

(наибольший размер образа в три символа).

а) Минимальная форма словаря: <МАК><РИС><ЛЕН><ДУБ>: R(ИС)=4R =2Е-, прогнозирование = 2Т (на образ), затраты энергии на распознавание = 4E-, контролирование потенциальной энергии ТФ = 8E+. Итог а) 2Е- + (2Т * 4(образов на ТФ=12) = 8E+) + 4E- = 2E+.

б) Максимальная форма (без дублирования, т.е. без полного пересечения): <АКР><ИСР><ИСМ><АКД> <УБЛ><ЕНД> … <АКМ>:

R(ИС)= 36R=18Е-, прогнозирование (Т) =+4E , затраты энергии на распознавание = 36E-, контролирование потенциальной энергии ТФ = 0E+. Итог б) = 50E- .

Лучший итоговый эволюционный потенциал = 2E+ , 50E- 2E+(!!).

28

Четвертая структуризация словаря

(наибольший размер образа в четыре символа)

а) Минимальная форма словаря: <МАК><РИС><ЛЕН><ДУБ>: R(ИС)=4R =2Е-, прогнозирование = 2Т (на образ), затраты энергии на распознавание = 4E-, контролирование потенциальной энергии ТФ = 8E+. Итог а) 2Е- + (2Т * 4(образов на ТФ=12) = 8E+) + 4E- = 2E+.

б) Максимальная форма (без дублирования): <АКРИ><ИСРИ><ИСМА> <АКДУ><УБЛЕ><ЕНДУ> … <АКМА>:

R(ИС)= 48R=24Е-, прогнозирование (Т) = 0Т (на образ), затраты энергии на распознавание = 48E-, контролирование потенциальной энергии ТФ = 0,5E+. Итог б) = 78E- .

Лучший итоговый эволюционный потенциал = 2E+ , 78E- 2E+

Пятая и другие структуризации словаря

Лучший итоговый эволюционный потенциал = 2E+ , 204E- 2E+

Шестая структуризация словаря, седьмая … и т.д. 2E+ !!! Худший - E-

Теоретический анализ результатов эксперимента показывает, что эволюционный потенциал ИС обратно пропорционален размеру словаря,

Размеры минимальных и максимальных словарей ИС соотносятся минимум как:

o(N) и o(N3) !!! O(n); ???где: N – максимальное число процессов в ПО

30

МАКРИСРИСМАКДУБЛЕН…

t01 t02 t03ПО

МАКРИС

ЛЕН ДУБ

N

£

АвтоструктуризацияАвтоструктуризация информацииинформации в ИСв ИС

ИС

АКРИСРИСМАКДУБЛЕНД …

АКМ

РИС ДУБ

МАКЛЕН

N=4

СN[L/£]

= N2+ [L/£]

L=3

o(N3) >> o(N) !!!

max min O(n); ???

Минимальный словарь ИС

-----> ! ! !

Образы ИС = процессам ПО

N2(L-1)=32

min

max

АвтоструктуризацияАвтоструктуризация сложных иерархических сложных иерархических

процессовпроцессов

ПО …ДА КОЛЯ ЛОВИТ РЫБУ СА… ИС

При минимизации словаря на нейросемантических структурах, его топология гомоморфна структуре исходных процессов ПО

Подл. Сказ. Обст.

{…}{…}{…}иерархическая

структура словарей образов

Подл. Сказ. Обст.

{…}{…}{…}иерархические

процессы

Теорема: минимальная форма словаря ИС может достигаться только при ее гомоморфности исходной структуре процессов ПО

Доказательство: Если представить формирование текстовой формы двумя независимыми и непересекающимися процессами А и Б, то становится очевидным,

проц. А проц. Б 010010 УКЛОН ЭРМИТАЖ 101010010

образ А образ Б

что минимальным словарем образов закрашивающим эти два процесса могут быть только образы совпадающие по текстовой форме с генерирующих их процессами.

На вопрос: "Почему все организмы 'единодушны' в класте- ризации окружающего нас мира на отдельные образы ?" Вытекает ответ: "Т.к. минимальный словарь, дает эволюци-онные преимущества, то все ИС данной ПО выбирают его, а соответственно, и его образы".

Из минимизации отображения в ИС гомоморфность

структуры образов в НСС структуре процессов ПО

НСС ПО

F

################## …########

~

Теорема: максимальное значение компрессии достижимотолько при гомоморфном отображении структуры процессов ПО в структуре образов НСС

Нейросемантическая форма представления

информации

Предметная область

11011010001101101001-

Алгоритм

НСС

Номера слоев

6 5 4 3 2 1

0

1 2 3 4 5 6 Номера элементов в слоях

N-элементы

Связи

"0" "1"

Семантика, тексты ПО, содержание процессов

НСС

Автоматическое выделение образов-процессов из предметной области в нейроподобные элементы НСС при минимизации ресурсных затрат (памяти)

N‑элемент (образ НСС) процесс предметной области

35

Автоструктуризация на нейросемантических структурах

RИС = f(число N-элементов, число связей)в битах

1/P (компрессия) = --------------------------------------------------------- 0 при t TФИС = объем текстовой информации в ИС в

битахили RИС / TФИС 0 и RИС const, при t M

при t

Примеры:а) <RISMAKDUBLENLENDUBMAKMAKLENRISRISLENMAKRISDUBRIS> правильно выделяются все процессы: <MAK><RIS><MAK><DUB>;б)<ДОМЗЕБРЫСКИТНАДОМДОМВНАДОМВСКИТВНАСКИТВВЗЕБРЫНАВНА>, правильно выделяются все процессы:<ЗЕБРЫ><СКИТ><ДОМ><НА>

<В>.сдвиг алфавита А в кодах ASCII в примере б)<ЕПНИЖВСЬТЛЙУОБЕПНЕПНГОБЕПНГТЛЙУГОБТЛЙУГЖВСЬОБГОБ> на +1 <?IGB@<KVLECMH;?IG?IG=H;?IG=LECM =H;LECM==B<KVH;=H;{> на -133.

36

Структуру памяти ИС, в которой выполняется свойство гомоморфного отображения ЭСЕ ПО и их структуры в образы ИС и обратно:

N‑элемент (образ ИС)    ЭСЕ (ПО)будем называть –

нейросемантической структурой нейросемантической структурой ((НССНСС))

НСС – это готовая структура данных (процессов и объектов) произвольной ПО для любой ИС.

Понятно, что ее автоматическое формирование открывает широкие горизонты для инженерии ИС.

37

НСС – это пример 1-го формального преобразования количественной текстовой формы представления информации в качественно новую форму –

структуру образов ИС

0

"без учителя" "игра"

Авто-струк-тури-зация

log (tn) (в битах)

"с учителем" – "школа"

1 —

Критерии достаточности: а) все пространство состояний; б) если человек может правильно структурировать данный текстовой материал в непривычной, но взаимнооднозначной нотации, в) наличие характерных особенностей динамического процесса при минимизации ресурса RИС

38

Расширив свойства формального нейрона введением в него относительности времени активации входов,

получим нейроподобный N-элемент.

U(t)= P1*X1(t0) + P2*X2+T2*(t2- t0) + … + Pk*Xk+Tk*(tk- t0) Fi (P,T)

U(t+1)= U(t)/a

U(t) Выход

Входы x1 x2 x3 xk

t0 dt2 dt3 dtk

Параметры ИС

Набор функционалов сходства Fi

. . .

* . . .

*

t *

* *

Входящие N-элементы Пространство образов Х

1 k

1

0

1 k

1

0

1 k

1

0

1 k

1

0

U(t) / U max

U m a x

U(t)

39

Объединив N-элементы в потенциальный многодольный иерархический граф, удалось получить структуру аналогичную естественно-языковым.

... ... ...

... ...

. ... ... ... ...

... ... ... ...

. . .

1 2 ... Номер N-элемента

k слоя

№ слоя

5 2

5 1

...

...

...

40

Структурное описание НСС можно представить в

виде многодольного графамногодольного графа:

k Номера входов слоев

2 6

2 5

2 4

2 3

2 2

2 1

1 0

1 2 3 4 5 6 Номера элементов в слоях

N-элементы

Связи

"0" "1"

Алгоритм обратного преобразования НСС в текстовую форму осуществляется уже за меньшее число операций и идет "сверху-вниз".

01100101011011011010001101101001

Текстовая форма Форма

НСС

Алгоритм А1

41

Первый слой (доля графа) N-элементов – терминальный, фактически отображает алфавит А ЭСЕ, второй слой – "псевдослоги" и строится на пространственно-временных ссылках на предыдущий (терминальный) слой - информационное содержание N‑элемента, слой "псевдослов" – ссылается на "псевдослоги" и т.д., до самого верхнего N‑элемента, отображающего в себе через связи всю ПО.

abcklltfdbababafgkdkediejjdjchhc Т е к с т о в о й п о т о к

"В с я П О" "Р а з д е л ы" . . . "Ф р а з ы" "С л о в а" "С л о г и" "А л ф а в и т"

Н о м е р с л о я k - в х о- д о в n 7 n-1 7 . . . 4 5 3 5 2 3 1 1

ИС \\\\\\ n-1 \\\\\\\\\\\\\\\\\\\\\\ n-2 . . . \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\ 3 \\\\\\\\\\\\\\\\\\\\\\\ 2 \\\\\\\\ 1

- N-э л е м е н т ы \\ - с в я з и

Н о м е р м е ж с л о й н о й с р е д ы с в я з и

ПО

Следует также отметить, что все технические характеристики ассоциативной памяти на базе НСС: - время доступа, - коэффициент компрессии-сжатия, - надежность хранения информации и др.) имеют тенденцию к улучшению, как в среднем, так и в абсолютных значениях, по мере роста объема вводимой информации из ПО.

Коэффи-циент сжатия

Р раз

log (tn) (в битах)

Надеж- ность ИС

Q %

Время доступа T сек.

0

P

Q T

1

q элемента

1

43

Величина компрессии отражает потенциальную интеллектуальность ИС.

Псевдофрактальные файлы.

Зависимость степени сжатия от размера файла, как Log 2(X) байт

0100200300400500600700800

10 11 12 13 14 15 16 17 18 19 20

Сж

ати

е NSS

RAR

ZIP

44

Адаптивные регуляторы на базе НСС

Примеры объектов управления

`

-3 -2 -1 0 1 2 3

Xn Fn

X0

` Xn

-3 -2 -1 0 1 2 3 Q

1 2 3 4 5 6 7

Xn Fn

Xn+1 = 1+ Xn + Fn + Zn

X0 Xn

а2 а1 а1 а3 а5 а4 а6 а7 аQ

-3 -2 -1 0 1 2 3

Xn Fn

Xn+1 = 2*Xn + Fn + Zn Xn+1 = f(Xn) + Fn + Zn

а) "Наклонная плоскость" б) "Обратный маятник"

с) "Неизвестный объект"

45

Таблица пространства состояний f(Xn) и Fn

Xn+1 = f(Xn) + Fn + Zn

N= 7 - число состояний объекта.(1 2)(2 3)(3 4)(4 5)(5 6)(6 7)(7 8) -пары (Xn Xn+1) отражают

f(Xn) перехода состояний объектаОбласть нормальных состояний объекта S – первый элемент пары (Xn Xn+1) = {1,2,3,4,5,6,7}.

F= -1, -2, -3, -4, -5, -6, -7, - возможные управляющие воздействия регулятора

Форма задания объекта

Адаптивный регулятор №1 на базе НСС.

е) д)

г)

в) б)

t0 tn t

а) Xn+1 = f (Xn) + Fn + Zn

X0

4-3 2-7

7-4 4-1 4-1 4-6

4-3 2-7

1 6 4 2 3 5 7 1 2 3 4 5 6 7

X -F

7-4 4-1 4-6 5-2

4-3 2-7 7-4 4-1 4-1 4-6 5 2 …

5-2 …

max F0

S Q F

47

Запоминая пары <X><Y> и их оценку <E> для любого априорно неизвестного объекта управления (f(Xn)), регулятор №1, фактически полным перебором, проходитвсе возможное пространство его состояний (N*M ).

0

10

20

30

40

50

60

1 6 11 16 21 26 31 36 41 46 51 56 61 66 71 76 81 86 91 96 101

Обуче ние

Настроенныйрегулятор

Адаптивный регулятор №2

е) д)

г) …

в) б)

t0 tn t

а) Xn+1 = f (Xn) + Fn + Zn

X0

4-3 2-7

7-4 4-1 4-1 4-6

1 6 4 2 3 5 7 1 2 3 4 5 6 7

X -F

4-3 2-7 7-4 4-1 4-6 5-2

4-3 2-7 7-4 4-1 4-1 4-6 5 2 …

5-2 …

max F0

S Q

x> x< x= =-4

=+1

R(X,F)

F

49

Скорость обучения регулятора №2 почти не зависит от размерностей N и M (N – число состояний объекта, M – число состояний возможного управления, в эксперименте для простоты принималось N = M = 7, 15, 17,19, 21), Т.е., пример регулятора №2 демонстрирует возможность практического преодоления "проклятия размерности".

0

50

100

150

200

250

1 12 23 34 45 56 67 78 89 100 111 122 133 144 155 166 177 188 199 210 221

регулятор №2

регулятор №1

0

50

100

150

1 6 11 16 21 26 31 36 41 46 51 56 61 66 71 76 81 86 91 96 101 106 111 116 121

регулятор №1

регулятор №2

50

Формирование понятия абстрактного числа в ИС (задача неразрешимая для классического ИИ, и легко решаемая биологическими ИС, как высшими животными, так и человеком).

Одно из физических свойств N‑элемента состоит в экспоненциальном

падении величины U(t+1) = ( U(t) + 1* ) / . после его активации

(напр., при =2)

Это пример сведения семантических характеристик ПО к физическим параметрам элементной базы ИС, т.е. сводимым к: См.-Бит-Сек – Система СБС

TL

U(t) 2

1

0

51

Адаптивный регулятор №3

1 2 3 4 5 6 7

Xn Fn

U(t) =1.5

|; ||; |||; ||||; |||||; … |||||||;

<3; 4><число><+t><больше><1; 4><число><+2t><больше>

…<3; 2><число>< -t><меньше><4; 1><число><-3t><меньше>

TL

U(t) 2

1

0

U(t) =1.0U(t) =1.5

U(t) =1.75

U(t) =1.96

t t

N-эл. "1" N-эл. "2" N-эл. "3"

N-эл. "7"

Upor, Fi

U(t)

<больше> <меньше>

На базе нейросемантического регулятора №3 формально показано, как на основе вышеописанных физических свойств N-элементов возможно естественное самоформирование R‑отношений, представленных в регуляторе №2. Тем самым, подведено теоретическое основание для инженерного построения ИР, т.е.:

теоретически решить проблему построения ИИ. Как и вычислительная техника начала развиваться с теоретических

моделей "машин Тьюринга и Поста", так и анализ работы нейросемантического регулятора будет способствовать формированию широкого фронта научных работ по разработке ИР.

Таким образом, на НСС-регуляторах можно продемонстрировать:- №1 – "адаптационность", как возможность адаптироваться в любой ПО; - №2 – "интеллектуальность", как возможность существенного

сокращения перебора;- №3 – "креативность", как целенаправленное порождение нового знания.

Пространство №1 >> №2 >> №3 : полного перебора >> пространство отношений >> энтропийное пространство

53

Функционирование примитивных ИС

В ИС отображается только объективная информация.

При этом, на каждое конкретное раздражение (Хi)

– конкретная реакция (Уj),

с "эмоциональной" оценкой ее полезности для ИС.

(Yj) Выход

Оценка (Е+)

ПО

ИС + --

Вход (Хi)

Fi(P,T) Max(U(t))

54

Память "сложных" ИС строится как иерархическая структура из НСС. На фактографическую НСС1, настраивается НСС2 ("ортогональная"), которая функционально воспринимает НСС1, также как НСС1 воспринимает ПО.

ПО

НСС 1

НСС 2 НСС 3

. . .

По нашим оценкам, структуры из 4-5-ти иерархических НСС вполне достаточно, чтобы моделировать основные психические функции человека

55

З Н А Н И ЕЗ Н А Н И Е (например, "логические высказывания") в текстовой форме обязательно содержат

ритмические п о в п о в т о р ет о р е н и ян и я !

|ВСЕ| |ВОЛК|И| |СЕР|Ы||А||ЕСТЬ| |ВОЛК|,||ЗНАЧИТ|,|А||ЕСТЬ| СЕР|ЫЙ|<E+>

|ВСЕ||ПЕТУХ|И||КРАСИВ|Ы||В||ЕСТЬ||ПЕТУХ|,||ЗНАЧИТ|,|В||ЕСТЬ|КРАСИВ|ЫЙ|<E+>

в НССНСС22 автоматически строится структура: |ВСЕ| |X1 |И| | X2 |Ы|, |X3| |ЕСТЬ| |X1 |, | |ЗНАЧИТ|, |X3| |ЕСТЬ| X2 |

Ы|Й|<E+> t1 t3 t2

<ВСЕ ПЛЮКИ КАНЫ, ОН ЕСТЬ ПЛЮК, ЗНАЧИТ, ОН ЕСТЬ >t2+Ы|Й<КАНЫЙ>

<ВСЕ ЛЮДИ СМЕРТНЫ, СОКРАТ ЕСТЬ ЛЮД, ЗНАЧИТ, СОКРАТ ЕСТЬ >, ИС в своей грамматике выдаст: <СМЕРТНЫЙ>.

Таким образом, все типы логических высказываний произвольной ПО покрываются одним механизмом НСС

НССНСС1

56

Информационный ресурс: "сигнал – информация – знание"

"линейный – сигнал", RИС= K*t +b1

Сигнал - простая суперпозиция ЭСЕ ПО;

"логарифмический – информация” RИС= log(t) +b2

Информация – знаковая последовательность на языке системы, соответствующая целому числу причинно-связанных процессов ПО, т.е. ЭСЕ

Данные – форматированная под ПО информация

"const - знание". RИС= const +b3 Знание – совокупность ЭСЕ, отражающих

одновременно процессы ПО и процессы в самой ИС

При TФ = const (t), RИС = f (SИС(t))

t

RИС

TИС

t

RИС

TИС

t

RИС

(бит)

TИС (бит)

Память ИС

57

Отображение информационного ресурса

тремя классами ИС

Сигнал Сигнал Сигнал

Сигнал Инфор- мация

Инфор- мация

Сигнал Инфор- мация

Знание

Автомат "животн." "ИС-человек"

БШ

ПС

"Телесериал"

Реальный

bsejgr…

abcabc...

Mather…

ПО

58

Текстовая энтропия

= p(s), при p(s) 1ТЭ(s)

= 1 - (p(s) - 1) / (m-1), при p(s) > 1

p(s) - частота на интервале L*AL, 0 p(s) m;

p(s)L / m = 1 (условие нормировки)

s - некоторое слово длиной в L символов;m - размер потенциального S‑словаря в m=AL S‑слов информационное пространство в L*m = L*AL символов

ТЭL = ТЭ(s)L / m 1

m

1

m

1

ТЭ

0 1 p(s) m

m=AL

…kksxkdkdfjfjgh…

Т=L*AL

А

. .

. 1

2

3

L

ac ab

a b c . . .

.

.

.

ba

b . .

b c

b c

aa

a .

b

c

a

ca cb bb

cc bc

Например, p(dkd)L=3

59

Относительная текстовая энтропия

И д е а л ь н ы й с л у ч а й н ы й с и г н а л

П с е в д о с л у ч а й н ы й

1

Т Э L

0 1 5 10 15 20 L

П е р и о д и - ч е с к и й с и г н а л Р е а л ь н ы й т е к с т

Р е а л ь н ы й т е к с т

С л у ч а й н ы й с и г н а л 1

O Т Э

0

1 5 10 1 5 2 0 L

Таким образом, числовые значения ТЭ и ОТЭ являются эффек-тивными параметрами-индикаторами, которые характеризуют возможность семантического анализа конкретной ПО (например, при поиске сигналов от внеземных цивилизаций).

Текстовая энтропия

60

Р е ш е н и е

И Р ИРМИ

Проекты:

- Искусственный разум

- Информоград

- Восхождение разума

61

Прототипы компьютерного интерфейса: “ человек-ИP “

с а м о р е ф л е к с и я

Последо- вательные каналы обработка информации

Входная Оценка Выходная информация соответствия информация

- "рецепторы" адекватности - "эффекторы" выхода на вход

Л П "Моти- Л П "Глаз" вация "Рука"

оценка"

Е=+0,3

"Ухо" "Речь" "эмоции" < м а ш и н а >

ПО

Парал- лельные каналы

Проект - Искусственный разум

По нашим оценкам через 12 месяцев возможно получить программную

реализацию описанного ИP. за 18 и 24 месяца, на базе многопроцессорных ЭВМ (256-

1024 RISC процессоров), сформировать многопроцессорный кластер и чисто аппаратную реализации ИP, реализуя естественную параллельность процессов в НСС.

ИP - это на 6-9 порядков ускорение решения любых "интеллектуальных" задач с одновременным повышением их сложности (числа компонент) на 5-6 порядков.

Для цивилизации, появление ИP, это как реальный шанс ее будущего, особенно в сегодняшнее неуправляемое время "технологий глобального (воз)действия" (биотехнологий, информационных, ядерных, финансовых), которые, в руках террористов, превращаются в орудие ада.

Без ИP человечеству в 21 веке практически не выжить и в подтверждение этого тезиса можно привести множество доводов

Проблемы решаемые только с помощью ИР- on-line структуризация и формирование глобальных БЗ;- "Госплан" Планеты;- Глобальный Университет (обучение);- Промышленная разработка информационного ресурса;- Безопасность Планеты; …

* 10 6-10

=

Объем памяти 1012-1016 образов (1024 текста, графики, …) Режим работы on-line: 50 пользователей - станция Sun; 1000 пользователей – многопроцессорная супер ЭВМ; 100 000 пользователей – аппаратная реализация ИРМИ. Язык диалога - естественный для каждого пользователя- исследователя. Когнитивные функции ИРМИ не уступают человеческим

Человек и искусственный разум

И Р ИРМ

И. . .

Человек и Машина (ИР) Страхи что ИР поработит человечество – типичный пример широко

распространившегося шаманизма от киноиндустрии. Для человека более опасен другой человек, т.к. у них одна ниша потребления. Генетически же ИР нацелен на космос – именно там широкое поле для его деятельности. Неограниченное количество любых материальных ресурсов вселенной не дает даже теоретических основ для конфликта между ИР с земным человеком.

С точки же зрения сотрудничества, ИР для человека представляется идеальным партнером, т.к. у них одна область производства легко тиражируемого результата. Где в итоге, каждый получает весь конечный продукт – новое знание (пример ИРМИ). Так что, никаких естественных оснований для конфликта между человеком и ИР нет. Сотрудничество же человека с ИР станет мощным стимулом для заключительного экспоненциального этапа научно-технического прогресса нашей цивилизации.

Работы над созданием ИР должны проводиться только в рамках нового гуманистического мировоззрения и специализированной международной академической инфраструктуры. Это необходимо, чтобы такой фактор, как ИР не стал "информационной дубиной" в руках какой-либо эгоистической группировки. В качестве такой начальной социально-экономической структуры по разработке ИP предлагается проект "Информоград".

65

Российский центр поддержки инноваций (проект "Информоград")

ИРМИ в рамках Российского центра поддержки инноваций (проект "Информоград") каждому исследователю даст в свое распоряжение колоссальные материальные и интеллектуальные возможности, о которых до этого не могли мечтать и целые государства.

В процессе взаимодействия при решении задачи, ИРМИ помогает человеку получить новое решение, человек при этом обучает ИР, представляя ему уже известные знания.

Новое же знание, полученное в ходе сотрудничества ИРМИ и человека, становится их общим знанием, взаимообогащая их обоих, как бы более интеллектуально ИР не превосходил человека.

$1500-3000$300-500

2006-2007 г

2006-2007 г

" И н ф о р м о г р а д "" И н ф о р м о г р а д "

Российский информационно-аналитический центр поддержки

инновационных работ

67

$1500-3000

Молодой российский выпускник за границей :

-Материальный достаток и хорошие бытовые условия

-Новейшее оборудование

-Иная культурная среда

-Работа на вторых ролях (мах post-doctor = м.н.с.)

-Малая перспектива роста

-2004 г число возвращающихся высококлассных специалистов (МФТИ, МГУ, МГТУ, МИФИ) сравнялось с числом отъезжающих за рубеж

$500-1000

Аутсорсинг

"Чем больше работаешь – тем больше остаешься должен" !

Российский рынок информационной безопасности в прошлом году составил $170 млн. и по предварительным прогнозам, в 2005 году вырастет до $230 млн., мировой рынок составит ~ $200 млрд.В этой области работает ~ 1 000 программистов из России. Они получают ~ $1000, сумма = $12 млн./год $230 млн. - $12 млн. = $220 млн. ??! (выплаты из России)В $200 млрд. (общ. объем $1 трлн.) ~ 10% труда россиян, а получают 0,5% или 1/200 от прибыли, принесенной ТНК

ТНК

Пример: 10 чел. за 12 мес. для ТНК делают ПО ИИС (цена ПО $1000)

Получают по $1200/мес. Семьи по 5 человек. Прож. минимум $200.

Доход семьи (страны) = $2400/год.

Семья разработчика ПО не может купить свой ПО (2400 << 5*1000 ) !!!

69

Нет более ценного товара, чем

ИНФОРМАЦИЯ (знание)

Инновационная экономика - стратегическое направление развития России в XXI веке

Создание единого информационного пространства (информационной инфраструктуры) технологии разработки знаний

Как не богата Росси я природными ресурсами, но основное её "богатство в мозгах, а не в недрах" Смена социально-экономической философии

Не догонять, а упреждать !!!

Не ЭВМ, а Искусственный разум !!!

"И н ф о р м о г р а д" это:

- Повышение производительности труда в 1000 раз

= 10 (этап постановки) *10 (НИР) *10 (НИОКР)- Экспериментально-опытное производство

(ЧПУ,…) = готовые изделия (патент, самолет, …)- Новые социально-экономические отношения = Ноосфера (социальный организм)- 2012 год Россия мировой лидер социально-

экономического развития (русский космизм)$300 000 - 500 000

71

Проект - Восхождение разума

72

Характеристики эволюционного процесса

высокоорганизованной материи

Цель – пролонгация лидирующего вида до горизонта прогнозирования будущего ( n(t), t∞).

– экспансия свободы вида ( n(t)=f(at), t∞, Q).

Мера – эволюционный потенциал (Э(Е) – НЭ(Е)), доступный ресурс ( n(t) max(E) Q), компрессия ( Pmax Q).

Механизмы – законы экспоненциальности (f(at),

и сверхаддитивности f(s1,…,sn)>>f(s1)+,,,+f(sn)

и алгоритмы НСС (C++, …)

73

Фазы эволюции высокоорганизованной

материи

Пространственная 1-я фаза

Пространственно-временная

2-я фаза

Временная 3-я фаза

Довещественная Вещественная Надвещественная

Эволюция форм материи и ее пространственно-временных фаз

Антропныйпринцип (Разума)

Флуктуация,Большой взрыв

Разум

В О С Х О Ж Д Е Н И ЕД е г р а д а ц и я

Б

Мы2006г.

74

СПАСИБО ЗА ВНИМАНИЕ

По всем вопросам Проекта (национального)

ИСКУССТВЕННЫЙ РАЗУМ обращаться к Бодякину Владимиру

E-mail: [email protected] www.informograd.narod.ru/

тел. (095)334-92-39 в ИПУ тел 1-346

Свойство доминирования "внутренних" информационных процессов (от НСС5 > НСС1) над "внешними" информационными процессами идущими от НСС1, назовем сознанием ИС.

Особенностью нейросемантической ИС является то, что в N‑элементе происходит слияние общепринятых понятий данных и алгоритма, как неделимого пространственно-функционального элемента – образа.

"Метаалгоритмом" поведения ИС является асимптотическая минимизация отображения (при t), всех значимых для неё текстовых потоков.

Формальная схема иерархического построения памяти ИС приводит к расширению языка, что позволяет "обойти" запрет теоремы Гёделя о неполноте формальных систем.

Так, если язык фактографической ИС (НСС1) представляет только <X><Y><E> (<стимул><реакция><оценка>), то иерархическая схема в НСС2 позволяет дополнительно описывать различные отношения R(<X><Y>) физических характеристик активируемых N-элементов и объединять все это с оценкой <E>. <X><Y><E>

< (<X><Y>) >< R(<X><Y>) >< E> < …

77

Алгоритм (А1) преобразования текстовой формы в иерархическую структуру словарей (НСС)

L = {01100101011011011010001101101001}.

Исходный текст

1-й шаг k1=2

l0 01100101011011011010001101101001 Номера цепочек

в словаре Последовательность индексов (ссылок) 1 2 3 4 l1 1 2 1 1 1 2 3 1 2 2 4 3 1 2 2 1 + "01"10"11"00“ L1

78

2-й шаг k2=2

l1 1211123122431221 Номера цепочек в словарях 1 2 3 4 5 6

12 11 31 22 43 21 L2l2 1 2 1 3 4 5 1 6 + "01"10“ 11"00" L1

79

3-й шаг k3=2

l2 12134516 Номера цепочек в словарях 1 2 3 4 5 612 13 45 16 L3 12 11 31 22 43 21 L2

l3 1 2 3 4 + "01"10“ 11“ 00" L1

80

4-й шаг k4=2

Номера цепочек в словарях l3 1234 1 2 3 4 5 6

12 34 L4 12 13 45 16 L3 12 11 31 22 43 21 L2

l4 1 2 + "01"10"11"00" L1

81

5-й шаг k5=2

и исходная последовательность символов полностью переходит в НСС.

Номера Ссылкисловарей 6 1 на предыдущие(слоев) 5 12 словари

4 12 34 и "алфавит" 3 12 13 45 162 12 11 31 22 43 21 1 "01"10“ 11“ 00"

1 2 3 4 5 6 Номера элементов в словаре

82

Номера 6 6 1 Ссылкисловарей 5 5 12 на предыдущие (слоев) 4 4 12 34 словари Включение 3 3 12 13 45 16 и "алфавит"в НСС 2 2 12 11 31 22 43 21 алфавита А 1 1 12 21 22 11

0 А "0" "1" 1 2 3 4 5 6

Номера элементов в словаре

83

Структурное описание НСС можно представить в виде многодольного графа:

Номера слоев 6

5 4 3 2 1

0

1 2 3 4 5 6 Номера элементов в слоях

N-элементы

Связи

"0" "1"

Алгоритм обратного преобразования НСС в текстовую форму осуществляется уже за меньшее число операций и идет "сверху-вниз".