O modelo de dados forma a base para padronizar dados em uma ampla gama de dados brutos de entrada. Uma solução DataOps industrial como HighByte Intelligence Hub permite que os usuários desenvolvam modelos que padronizem e contextualizem dados industriais. Em resumo, o HighByte Intelligence Hub é um hub de dados com um mecanismo de modelagem e transformação em seu núcleo.
Mas o que exatamente é um modelo de dados e por que a modelagem de dados é importante para a Indústria 4.0? Este artigo tem como objetivo abordar essas perguntas e fornecer uma introdução à modelagem de dados em escala.
O que é um modelo de dados?
Um modelo de dados é uma definição que descreve um pedaço rico de informação. A informação pode ter muitos atributos diferentes, alguns contendo dados operacionais brutos em tempo real e outros que definem realmente esses dados. Este último fornece contexto, que poderia ser uma descrição da fonte, unidade de medida, faixas mínima e máxima e outros tipos de informações que, quando reunidas, definem um pedaço de informação que corresponde a uma coisa real, como um ativo, processo, sistema ou papel.
Embora os modelos de dados sejam entidades bem conhecidas na indústria de automação industrial, eles têm muitos nomes. Dependendo do seu nível de experiência ou função, você pode estar acostumado a diferentes convenções de nomenclatura. Por exemplo, se você é um engenheiro de controle que modela conjuntos de dados complexos em um CLP, pode se referir ao modelo de dados como uma “tag definida pelo usuário”. Outros associam modelos de dados à biblioteca de tags complexas embutidas que são fornecidas por padrão com base na implementação do fornecedor de CLP. Ainda outros podem pensar em modelos de dados simplesmente como a estrutura de como qualquer dado é disposto em termos de nomes, pontos de dados, tipos de dados e se essas propriedades são necessárias ou não.
A indústria também se uniu para criar modelos de dados ou conjuntos de dados padronizados, que às vezes são específicos para uma indústria vertical particular. Esses modelos definem a nomenclatura, como os dados devem ser representados e a estrutura do modelo (como ele é disposto). Estou me referindo a modelos padronizados como ISA-95 e especificações complementares para OPC UA.
No entanto, ainda existem muitos modelos de dados em uso que são específicos do fornecedor (às vezes até específicos do dispositivo) e, portanto, não padronizados em toda a indústria. Sistemas de TI e aplicativos em nuvem também têm suas expectativas sobre como os dados devem ser modelados, recebidos e armazenados. Entre dispositivos, sistemas e aplicativos OT e IT, há muita diversidade de modelos de dados e pouca padronização na prática real.
Por que a modelagem de dados é importante?
A modelagem de dados é importante porque os modelos padronizam informações, permitem a interoperabilidade, mostram a intenção, determinam a confiança e garantem a governança adequada dos dados.
Para expandir essas ideias, a modelagem de dados permite a padronização de como os dados são categorizados e reunidos para obter significado adicional. A modelagem permite a interoperabilidade ao compartilhar informações entre várias aplicações ou entre pessoas com diferentes conhecimentos e usos para os dados. Usuários com funções diferentes precisam ser capazes de olhar para os dados e entender rapidamente sua fonte, estrutura e o que o modelo representa (como uma bomba ou uma linha de produção). Esse contexto e metadados são o que torna a modelagem tão importante.
Além disso, a modelagem de dados mostra a intenção: o que um valor é, o que deve ser, se está dentro de uma faixa aceitável e se pode ser confiável. Ao modelar dados com uma camada de abstração dedicada à mesclagem, modelagem e compartilhamento seguro de dados, ajudamos a garantir a governança adequada dos dados. Seja com uma governança de dados dedicada na empresa ou simplesmente um conjunto de regras publicadas, a governança de dados dita como as informações devem ser compartilhadas entre as unidades de negócios e determina a uniformidade dos dados. E, é claro, a governança garante que os dados possam ser entendidos e distribuídos apenas para os sistemas e usuários que precisam acessar essas informações.
Como é um modelo de dados?
Um modelo de dados não é – e não deve ser – complicado. Em sua definição mais básica, um modelo de dados são pares de nome-valor de um para muitos. Os modelos de dados são criados como coleções lógicas desses pares de nome-valor que estão relacionados de alguma forma e – quando juntos – se tornam um objeto de informação valioso e útil.
Por exemplo, você pode criar um modelo de dados que represente um termostato. O primeiro atributo é um valor atual. O segundo atributo é um valor de ponto de ajuste. O terceiro atributo é um valor de unidade. O modelo articula claramente como um termostato deve ser representado para a empresa. Neste exemplo, cada termostato terá um nome, valor atual (um valor de ponto flutuante), ponto de ajuste e unidade de medida (um caractere estático que indica graus Fahrenheit ou Celsius).
Um termostato é obviamente uma coisa simples de modelar. Mas esse mesmo conceito se aplica até mesmo ao processo ou equipamento mais complexo que você deseja modelar. Você vai destilar o modelo até seus pontos de dados mais primitivos que, juntos, têm um significado mais importante. Você incluirá quaisquer atributos contextuais no modelo que descrevam o que são os pontos de dados e o que devem ser, de modo que a informação se torne auto-descritiva para qualquer consumidor do modelo de dados resultante.
Minha dica para quem está começando com a modelagem de dados é começar com coisas simples. Os modelos não precisam ser complicados. Modelos eficazes destilam conjuntos de dados até sua forma mais simples para que possam ser fácil.
*This blog post was originally posted in English on 22/02/2021 on HighbyteThe post has been translated and reposted here with the express written permission of our partners at HighByte. Posted by Toni Paine.
*Este post foi originalmente postado em inglês em 22/02/2021 no Highbyte O post foi traduzido e repostado aqui com a permissão expressa por escrito de nossos parceiros da HighByte. Postado por Tony Paine