Smart ontologies

The semantic web technologies introduced interesting ideas like RDF and semantic reasoning with OWL. We can produce new facts from old facts.

YAML Вопрос

A Django ontology is just one kind of specification of an ontology It's used to create databases and generate ORM queries.

Infinity family has a rich ontology because it can be used to execute business. Business software like ERP has a complicated ontology.

Multiple kinds of things can be considered to be ontologies.

There are other technologies such as RDF and OWL which allows reasoning over relationships. There is an application I recommend called Protege which is very good for automated reasoning.

I can say that a mother is a female human with a child and then I can generate a fact when a woman is a mother.

Having knowledge graphs allows for powerful automated reasoning and automation opportunities.

In my fact collector project I use Prolog to do sime reasoning.

Inference means a query and find the free variable, such as X. Logic is a statement that is true. Here I ask two questions (1) who am I mutually friends with and (2) who am I friends with but who doesn't consider me a friend.

"Logic likes(sam, john).",

"Logic likes(sam, peter).",

"Logic likes(john, sam)."

"Inference and(likes(sam, X), likes(X, sam)).",

"Inference and(likes(sam, X), \+(likes(X, sam))).",

]

The answer to the first question is john. So the answer to the second question is peter

We need a rich specification of data relationships to create instances of ontologies.

With ontologies that define steps or temporal relationships like Datalog we can create automated workflow systems or automated interoperability

With ontologies we can traverse the system itself.

https://stackoverflow.com/questions/10263970/traversing-recording-matched-predicates


Нет дочерних категорий.


Голос (Необязательно) (не уведомлять) (Необязательно)
Пожалуйста, войдите.

Рассмотрение онтологий - это частный случай запросов к наборам данных, и большинство баз данных являются просто специализированными онтологиями, оптимизированными для определенных типов запросов. Некоторые базы данных, такие как тройные хранилища, могут быть оптимизированы или сделаны логическими выводами.

Вы правильно заметили, что онтология семейства Infinity прагматична с точки зрения бизнеса. Фактически, я работал над Odoo (ранее OpenERP), который представляет собой Wordpress-подобную среду для работы предприятий, и я подумал (назад в 2010) - что корпорации с расширенным искусственным интеллектом уже появляются, поэтому нам нужна система, которая позволила бы им быть прозрачными для общества, и, поскольку компании - это просто совокупность людей, я подумал, что должен существовать общий знаменатель между тем, как работают отдельные лица, компании и даже правительства, и фактически онтология семейства Infinity - это попытка прийти к этому общему знаменателю из первых принципов, описанных в статья о модели уравнения. Более конкретная версия этого - NRV (словарь сетевых ресурсов), идея которого состоит в том, чтобы ввести что-то вроде Номера кодов ответов HTTP для ответов, а скорее семантические коды для объектов данных.

Теоретически, чтобы сделать системы понятными, мы можем обойти все системы (например, каждое приложение) и пакеты данных (например, интернет-трафик) и спроецировать их в семантическое пространство человека, - прикрепив такие коды к их таблицы, запросы и ответы - делают все системы понятными для людей и даже делают их математически понятными.

Reasoning on ontologies is a special case of querying of datasets, and most databases are just specialized ontologies, optimized for certain types of queries. Some databases, like triple-stores, may be optimized or logical inferences.

You're correctly noticing that Infinity family ontology is pragmatic from the business sense. In fact, I had worked on Odoo (previously OpenERP), which is a Wordpress-like framework for enterprises to run, and I thought (back in 2010) -- that AI-augmented corporations are already happening, so, we need a system that would enable them to be transparent with the society, and, since companies are just sums of people, I thought, there must exist common denominator between how individuals, companies, and even governments operate, and in fact, the Infinity family ontology is an attempt at arriving to that common denominator from the first principles, described in the paper on the equation model. A more concrete version of that, is the NRV (network resource vocabulary), the idea of which is to introduce something like HTTP response code numbers to responses, but rather, semantic codes to data objects.

In theory then, to make systems understandable, we can go around all the systems (such as each app) and data packets (such as the internet traffic), and project them in the human semantic space, -- by having such codes attached to their tables, requests and responses -- make all systems understood to humans, and even make them mathematically tractable.


Было бы неплохо иметь онтологию для компьютеров и отношений между файлами, процессами, потоками, контейнерами, разрешениями и т. Д.

Тогда у нас была бы простая структура данных для всего, что не было так определено реализацией.

Would be nice to have an ontology for computers and relationships between files, processes, threads, containers, permissions etc

Then we would have a simple data structure for everything that wasn't so implementation defined.



    :  -- 
    : Mindey
    :  -- 
    

chronological,

Я не знаю, как работают механизмы рассуждений, но я думаю, что это дублированное приложение modus ponens

Было бы неплохо, если бы он был встроен в базу данных или механизм пролога встроен в базу данных. Вы можете создать факты, например, если кто-то моложе 25 лет, он использует Gmail только в качестве своего почтового провайдера на основе данных базы данных.

I don't know how reasoning engines work but I think it's a replicated application of modus ponens

It would be nice if you had one built into a database or a prolog engine built into a database. You could generate facts like if someone is aged under 25 they only use Gmail as their mail provider based on database data.


Разве это не просто вычисленные (виртуальные) свойства «наборов объектов, связанных желаемыми свойствами» (комбинированный виртуальный объект)?

В качестве примера вычисляемых свойств мы можем подумать о

_ "если кто-то моложе 25 лет, он использует Gmail в качестве почтового провайдера только на основе данных базы данных" _

как одно вычисляемое логическое свойство, а именно Object.use_only_gmail (age): age <25 => True? False к объектам, имеющим свойство age. Значение можно рассматривать как просто вычисление свойства. Уровень достоверности также можно описать, просто вычислив свойство и заметив, что на самом деле это утверждение охватывает только 95% случаев.

В качестве примера комбинированных виртуальных объектов рассмотрим следующий запрос:

_ "Поиск случаев, когда совместное размещение ровно 2 объектов возрастом старше 25 лет порождало 2 живых объекта младше 1 года в течение периода менее 1 дня." _

Если предположить, что «порождение 2 объектов» и «совместное размещение» не является чем-то, что база данных естественным образом отслеживает, вычисление такого свойства будет включать создание «объединенного виртуального объекта» (скажем, случай, когда наблюдается графическая модель объединения объектов с совместным размещением) , а затем вычисление логического свойства для таких виртуальных объектов, ответив, что было создано ровно 2 объекта.

Я не понимаю, зачем нам больше нужны хранилища триплетов: все это более естественно выполнимо с помощью только вычисляемых свойств и их шаблонов, определяемых запросами. Шаблон - это просто «комбинированный виртуальный объект», поэтому запрос - это просто конструкция «виртуального объекта шаблона» (на самом деле, я объяснил это в «целесообразность "раздел о желаемых свойствах данных, если они дополнены метаформатом). Это позволило бы запросить любые мыслимые шаблоны.

Isn't it just computed (virtual) properties to "sets of objects interlinked by desired properties" (a combined virtual object)?

For an example of computed properties, we can think of

"if someone is aged under 25 they only use Gmail as their mail provider based on database data"

as a single computed boolean property, namely Object.use_only_gmail(age): age < 25 => True ? False, to the objects that have "age" property. An implication can be viewed as just a property computation. The confidence level can be described, too, by simply computing the property, and observing that, in actuality this statement covers just 95% of cases.

For an example of a combined virtual objects, consider the below query:

"Search for the cases, where collocation of exactly 2 objects aged above 25 had spawned 2 living objects aged below 1 during a period of less than 1 day."

Assuming that the occurrences of "spawning 2 objects" and "collocation" is not something that the database naturally tracks, computing such property would involve creating "combined virtual object" (say, an occurrence where graph pattern of spanning objects with collocation is observed), and then computing the boolean property to such virtual objects, answering that exactly 2 objects were spawned.

I don't see why we'd need triplets stores anymore: it's all more naturally doable with just computed properties and their patterns specified by queries. A pattern is just a "combined virtual object", so, a query is just a construction of a "template virtual object" (in fact, I've explained that in "purposefulness" section about desired data properties, when supplemented with metaformat). This would enable to query for any patterns imaginable.


Проблема с вычисляемыми свойствами на языке программирования - вне базы данных - в том, что они не очень эффективны. Вам потребуется поддержание истины, которое может оказаться дорогостоящим, если будет наивно реализовано.

Blazegraph (с тех пор, как их приобрела Amazon) и Jena Fuseki - тройные магазины, в которых есть функции поддержания правды.

Не сбрасывайте со счетов то, что предлагают тройные магазины.

Если бы база данных могла иметь виртуальные свойства, которые были реализованы внутри базы данных - а также обновлялись при любой вставке или изменении данных - тогда да, это могло бы быть эффективным.

The problem with computed properties in programming language - outside the database is that they're not very efficient. You would need truth maintenance which can be expensive if naively implemented.

Blazegraph (since acquired by Amazon) and Jena Fuseki are triple stores have truth maintenance features.

Don't discount what triple stores bring to the table.

If a database could have virtual properties that were implemented inside the database - also updated on any insert or changing data - then yes it could be efficient.



    : Mindey
    :  -- 
    :  -- 
    

chronological,

Также этот пример был предполагаемым правилом. Возраст менее 25 человек, использующих Gmail, определяется базой данных на основе этих данных.

Это корреляция каждой части данных со всеми остальными данными. Может быть реализовано с помощью простого цикла и корреляционной функции

Also that example was an inferred rule. The age less than 25 people use gmail is something that is learnt by the database based on the data.

It's a correlation of every piece of data with every other piece of data. Could be implemented with a simple loop and correlation function



    : Mindey
    :  -- 
    :  -- 
    

chronological,

Ну, тройки избыточны, потому что кортежей достаточно: (a, b, c) = ((a, b), (b, c)) (point (video) Я написал по электронной почте [Telmo]).

Таким образом, мы можем рассматривать тройные хранилища просто как семантические индексы . Да, индексы ускоряют запросы, но в остальном они избыточны. Когда дело доходит до семантического индексирования, было бы разумно делать такие упомянутые «тройки» не только между более популярными узлами графа, но и между узлами гиперграфа (выполняя индексирование с указанием мощности .org / wiki / Power_set) в большинстве случаев, скорее всего, исчерпает вычислительные ресурсы).

Есть ли вообще такое понятие «семантическое индексирование» в литературе? Кажется, никто не называет «тройное хранилище» для базы данных «семантическим индексированием».

Well, triples are redundant, because tuples are enough: (a, b, c) = ((a, b), (b, c)) (the point (video) I made in an e-mail to [Telmo]).

Thus, we can think of triple stores as just semantic indices. Indices speed up querying, yes, but but otherwise, they are redundant. When it comes to semantic indexing, then, it would make sense to make such said "triples" not just between more popular graph nodes, but hypergraph nodes as well (doing the power-set indexing would likely exhaust computational resources in most cases).

Is there at all such concept of "semantic indexing" in the literature? It seems nobody calls "making triple stores" for a database -- "semantic indexing".