Engenharia do conhecimento UFS-GISI: dezembro 2014

terça-feira, 9 de dezembro de 2014

Engenharia do Conhecimento em redes sociais

As mídias sociais tem feito uso de técnicas de Engenharia do Conhecimento para auxiliar na gestão do conhecimento que nelas circula diariamente. Entre as técnicas de Engenharia de Conhecimento aplicadas em mídias sociais pode-se citar:

Tags: conforme Xu et al (2006), tagging é um processo pelo qual os usuários atribuem rótulos (na forma de palavras chave) para conteúdos da web com o propósito de compartilhar, descobrir e recuperá-los. “Descobrir” permite aos usuários encontrar novos conteúdos de seu interesse compartilhado por outros usuários. “Recuperar” permite a um usuário relembrar conteúdos que foram descobertos antes. Além disso, o processo de tagging permite a classificação e a organização de dados para utilizar os metadados de usuários individuais diretamente, trazendo benefícios da Web Semântica para a web atual, dominada pelo HTML. Os usuários podem utilizar rótulos para marcar qualquer conteúdo, ou usar uma combinação de tags para expressar o interesse de conteúdos assinalados por outros usuários, o que é mais flexível do que ter que “encaixar” os conteúdos em uma ontologia universal. O processo de tagging é a base para a formação de folksonomies.
Ontologies: para Gruber (1993), uma ontologia é uma especificação formal e explícita de uma conceitualização compartilhada. Ontologia é um conjunto de termos ordenados hierarquicamente para descrever um domínio que pode ser usado como um esqueleto para uma base de conhecimentos. Uma ontologia deve possuir um conjunto de termos organizados com uma hierarquia associada, ou seja, uma taxonomia. Uma das principais utilidades de uma ontologia é a de servir como um “schema” para uma base de conhecimentos, visão essa muito comum dentro do ramo da gestão de conhecimentos.
Folksonomy: Sturtz (2004), define folksonomy como sendo o conjunto completo de tags – uma ou duas palavras-chave – que os usuários de um sistema compartilhado de gerenciamento de conteúdo associam a partes individuais de conteúdo, a fim de agrupar ou classificar o conteúdo. Os usuários também podem adicionar outros termos a folksonomy, a medida que estes se tornam necessários para associação com determinado conteúdo. Ao contrário do conceito de metadados (palavras – chave “escondidas” da visão dos usuários e usados apenas para auxiliar na busca), as folksonomies estão na “superfície”, visíveis e úteis. Elas vão além da metáfora da pasta (diretório local de um computador). permitindo aos usuários arquivar seus conteúdos em muitos lugares ao mesmo tempo. Através de co-atribuição de termos, a folksonomy desenvolve uma estrutura baseada na convergência e no uso.
Taxonomy: para Diaz, Joyanes e Medina (2009), taxonomia é a tecnologia que trata dos princípios, métodos e finalidade da classificação, sendo utilizada para a gestão eficiente da informação e conteúdos, e é considerada o elemento essencial na construção do conhecimento dentro das organizações.
Semantic social network analysis: segundo Ereteo et al (2011), pode-se representar a interação de usuários em sites de rede social usando ontologias diversas, tanto para representar as parte explícita da rede social (rede de amigos, etc.), quanto para a construção de gráficos de usuários com base em outros marcadores implícitos. De forma complementar, deve ser utilizado o enriquecimento semântico provido pelas folksonomies, para identificar comunidades de interesse. Com base nos gráficos obtidos, é possível analisá-los por meio da técnica de análise de redes sociais (Social Network Analysis), a qual busca entender e explorar as principais características das redes sociais, a fim gerenciar seu ciclo de vida e prever a sua evolução.

Fonte: http://www.egc.ufsc.br/wiki/index.php/Processo_de_Engenharia_do_Conhecimento

Importância nas organizações

Visto algumas metodologias e ferramentas relacionadas à Engenharia do Conhecimento, é possivel notar como elas são importantes para as organizações.

Os data warehouses servem como um extrato das informações da organização, auxiliando no processo de tomada de decisão baseado nesses conhecimentos. Eles podem ser usados, por exemplo, no processo de Business Intelligence (Inteligencia Empresarial), onde ocorre a busca e tratamento de informações que apoiam a gestão de um negócio. Outra ferramenta que utiliza os data warehouses é o OLAP (Processo Analítico em Tempo Real, em português) que por sua vez pode ser aplicado em várias áreas das organizações como financeira e marketing.

A plataforma Protégé, pode ser aplicada pois inclui classificadores dedutivos para validar que os modelos de gestão da informação, além de serem consistentes e inferir novas informações a partir da análise de uma ontologia.

Como Eclipse, Protégé é um quadro para o qual vários outros projetos sugerem plugins. Este aplicativo é escrito em Java e fortemente utiliza Swing para criar a interface de usuário bastante complexa.

Assim, a Engenharia de Conhecimento é um recurso valioso para as organizações, visto que com ela é possivel organizar as informações e os conhecimentos de maneira que estes sejam utiliza-dos em sistemas de suporte à a decisão, possibilitando uma vantagem competitiva para a corporação.

Camadas da Web Semântica

Olá, já falamos sobre Web Semântica aqui. E hoje daremos continuidade falando sobre as camadas da Web semântica que compõem sua arquitetura.

O texto a seguir que explica sobre essas camadas foi retirado do artigo produzido por Leandro Gomes de Miranda, chamado WEB SEMÂNTICA E WEB SOCIAL EM ENGENHARIA DO CONHECIMENTO e o encontramos no tópico 2.1 Camadas da Web Semântica . No final do desse post terá o link para acesso do artigo na integra.

Começaremos falando das quatro camadas mais baixas: URI, UNICODE, XML e Namespaces.

A primeira camada que iremos falar é a URI

O URI (Uniform Resource Identifier) é um padrão para identificar um recurso físico ou abstrato de maneira única e global. Um identificador URL é um caso específico de URI, formado pela concatenação de seqüências de caracteres para identificar o protocolo de acesso ao recurso, o endereço da máquina na qual o recurso pode ser encontrado e o próprio recurso em questão (RIBEIRO, 2008).

Ao lado do URI vemos o Unicode:

O Unicode fornece um número único para cada caractere, não importa a plataforma, não importa o programa, não importa a língua, ou seja, é basicamente um sistema padronizador de caracteres. Fundamentalmente, os computadores lidam com números, gravam letras e outros caracteres na memória designando um número para cada um deles. Antes de o Unicode ser inventado, havia centenas de sistemas diferentes de codificação. Nenhum destes Sistemas de codificação, no entanto, poderia conter caracteres suficientes. Por exemplo, a União Européia por si só requer vários sistemas de codificação diferentes para cobrir todas as línguas. Mesmo para uma única língua como o inglês não havia sistema de codificação adequado para todas as letras, pontuação e símbolos técnicos em uso corrente.

A cima deles dois temos XML:

Verificou-se que o XML, criado pela W3C em 1996 (BRAY, 2006) seria a linguagem de marcação mais apropriada para o uso na Web Semântica, quando comparado ao HTML ou SGML, por diversas razões, como por exemplo: deve ser fácil escrever programas que processam documentos XML; documentos XML devem ter uma linguagem clara, suficientemente legíveis por pessoas; o formato do XML deve ser formal e conciso; da linguagem XML deve ser fácil de criar; o XML é compatível com SGML e HTML.

A ultima camada que apresentaremos hoje é a Namespace:

O namespaces, parte da tecnologia XML, e permite que o vocabulário utilizado no documento XML possa ser identificado unicamente por um URI. Com a utilização de namespaces, é possível identificar as tags que estão sendo utilizadas dentro de um contexto definido em algum lugar da web (LAURENT, 2000). Os namespaces fornecem um método para qualificar os nomes de elementos e atributos, utilizados nos documentos XML, através da associação destes nomes com os espaços de nomes identificados por referências de URI. Os espaços de nomes são úteis para distinguir entre dois elementos definidos com um mesmo nome, mas que pertencem a esquemas diferentes. Além disso, um documento pode associar elementos previamente definidos à sua estrutura, desde que utilize referências aos esquemas que definem esses elementos (RIBEIRO, 2008).

Abaixo temos o link para acesso ao artigo onde pode-se ler o conteúdo acima.

Fonte:

MIRANDA, L. G. WEB SEMÂNTICA E WEB SOCIAL EM ENGENHARIA DO CONHECIMENTO. Disponível em <http://www.abepro.org.br/biblioteca/enegep2009_TN_WIC_098_664_13224.pdf>

terça-feira, 2 de dezembro de 2014

Estrutura metodológica que norteia a construção de sistemas baseados em conhecimento

A CommonKADS ^[1] é uma estrutura metodológica que norteia a construção de sistemas baseados em conhecimento para a resolução de problemas que envolvem conhecimento. Shereiber (1999) descreve a metodologia CommonKADS como uma extensão de metodologias já existentes (análise estruturada de sistemas, teoria da organização, orientação a objetos, processos de reengenharia e gestão da qualidade), empregada quando a tarefa, o processo, domínio ou aplicações tornam-se intensivas em conhecimento.Essa metodologia consistem em tenta responder as três perguntas Por que, O que e Como.
A resposta para o "porque" é apresentada na camada de contexto onde estão os motivos as característica geral da organização, tem uma visão geral e ampla das atividades a serem desenvolvidas.Esta camada tem três sub divisões: modelo de Organização,modelo de Tarefa,modelo de Agente.

Modelo de Organização

Analisa a estrutura anterior da empresa ,problemas ,falhas , e os possíveis impactos das futuras ações no conhecimentos propostas, ela se divide em 5 planilhas de ação.

Modelo de Tarefa

Como o próprio nome já diz esse modelo compreende quais as tarefa deveram ser feita ,como serão feitas para garanti o resultado esperado. ela se divide em 2 planilhas .

Modelo de Agente

Esse modelo especifica os agente executores das tarefas.Tem apenas 1 planilhas.

"O que" e encontrado na camada conceitual responsável pro especificar em detalhes os tipos de estrutura de conhecimento e suas interações para a realização das tarefas .Ela esta dividida em 2 modelos: modelo do conhecimento,modelo de comunicação.

Modelo de do Conhecimento

Esta modelo e o que contem a maior maior contribuição pra o sucesso da metodologia pois contem em detalhes todos os requisitos de conhecimento e que tem que ter esse conhecimento para a realização das tarefas.Esta camada é dividida em três níveis (conhecimento de domínio, inferência, tarefa).

Modelo de Comunicação

Responsável por orientas a comunicação entre os agentes executores das tarefas.

O " como" é apresentado na camada de projeto

Camada de Projeto

Camada responsável por transforma todas as outras em especificações técnicas para construção do sistemas (software ) em sua totalidade.

Fontes:

↑ Knowledge Engnireeng and Management: the CommonKADS Methodology
http://www.egc.ufsc.br/wiki/index.php/Processo_de_Engenharia_do_Conhecimento#CommonKADS

Data Warehouse (DW)

Dentre as ferramentas utilizadas na Engenharia de Conhecimento, é possível citar a Data Warehouse (DW).

DW é um depósito para todas as partes significativas de dados que são extraídos de várias fontes e organizados de forma a facilitar seu acesso e análise.

O Data Warehouse serve para recolher informações de uma empresa, além de criar um histórico

dessas informações, definindo assim padrões que facilitam sua organização facilitando assim sua pesquisa e análise para auxílio no processo de tomada de decisões.

DW pode ser aplicado em data mining, web mining e sistemas de apoio a decisão.

Fontes:

http://searchsqlserver.techtarget.com/definition/data-warehouse

http://egc.ufsc.br/wiki/index.php/Processo_de_Engenharia_do_Conhecimento

Metodologias do Conhecimento - Protégé

O que é Protégé?

Uma plataforma de software livre que disponibiliza um conjunto de ferramentas para construção de modelos de domínio e aplicações baseadas em conhecimento por meio de ontologias.

Essa plataforma implementa um conjunto de estruturas de modelagem de conhecimento que possibilita a criação, visualização e manipulação de ontologias em diversos formatos, pode ser configurado para prover apoio amigável ao domínio na criação de modelos de conhecimento e entrada de dados.

Uma ontologia como já citada aqui no blog, descreve conceitos e relações que são importantes em um domínio particular, variam desde taxinomias e classificações, esquemas de base de dados, e teorias totalmente axiomatizadas.

A plataforma apoia duas formas de modelar ontologias:

O Editor de Frames-Protégé capacita a construir popular ontologias que são baseadas em frames, conforme um protocolo aberto conectividade de bases de conhecimento.

O Editor Protégé-OWL capacita a construir usuários a construir ontologias para Web Semântica, em particular na liguagem W3C OWL.

Fonte: Método Protégé

Eriksson, H., Shahar, Y., Tu, S. W., Puerta, A. R. & Musen, M. A. [1995], ‘Task modeling with reusable problem-solving methods’. Artificial Intelligence 79(2), 293–326
Puerta et al., .A multiple-method Knowledge acquisition shell for the automatic gen eration of knowledge-acquisition tools. Knowledge Acquisition, 4, 171-196. 1992.