domingo, 30 de setembro de 2007

DataWarehouse - OLAP

quinta-feira, 27 de setembro de 2007

DataWarehouse - Definições e Características






Definição


Um data warehouse (ou armazém de dados, ou depósito de dados no Brasil) é um sistema de computação utilizado para armazenar informações relativas às atividades de uma organização em bancos de dados, de forma consolidada. O desenho da base de dados favorece os relatórios, a análise de grandes volumes de dados e a obtenção de informações estratégicas que podem facilitar a tomada de decisão.

O data warehouse possibilita a análise de grandes volumes de dados, coletados dos sistemas transacionais (OLTP). São as chamadas séries históricas que possibilitam uma melhor análise de eventos passados, oferecendo suporte às tomadas de decisões presentes e a previsão de eventos futuros. Por definição, os dados em um data warehouse não são voláteis, ou seja, eles não mudam, salvo quando é necessário fazer correções de dados previamente carregados. Os dados estão disponíveis somente para leitura e não podem ser alterados.

A ferramenta mais popular para exploração de um data warehouse é a Online Analytical Processing OLAP ou Processo Analítico em Tempo Real, mas muitas outras podem ser usadas.


Características

Orientação por assunto
A orientação por assunto é uma característica marcante de um DW, pois toda modelagem será voltada em torno dos principais assuntos da empresa. Enquanto todos os sistemas transacionais estão voltados para processos e aplicações específicas, os DWs objetivam assuntos.

Integração
Facilmente o mais importante aspecto do ambiente de Data Warehouse é que dados criados dentro de um ambiente de Data Warehouse são integrados. SEMPRE. COM NENHUMA EXCEÇÃO. A melhor essência do ambiente de warehouse é que dados contidos dentro dos limites do warehouse estão integrados. A integração mostra-se em muitas diferentes maneiras: na convenção consistente de nomes, na forma consistente das variáveis, na estrutura consistente de códigos, nos atributos físicos consistente dos dados, e assim por diante.

Variância no tempo
Segundo W.H.Inmon, os Data Warehouses são variáveis em relação ao tempo, isso nada mais é do que manter o histórico dos dados durante um período de tempo muito superior ao dos sistemas transacionais, vejamos abaixo mais algumas características.

Num DW é normal mantermos um horizonte de tempo bem superior ao dos sistemas transacionais, enquanto no OLTP mantemos um histórico curto dos dados, no DW guardamos esses dados num período maior. Isso é bastante lógico porque num sistema transacional a finalidade é de fornecer as informações no momento exato, já no Data Warehouse, o principal objetivo é analisar o comportamento das mesmas durante um período de tempo maior. Fundamentados nessa variação, os gerentes tomam as decisões em cima de fatos e não de intuições.

Não volatidade
No DW existem somente duas operações, a carga inicial e as consultas dos front-ends aos dados. Isso pode ser afirmado porque a maneira como os dados são carregados e tratados é completamente diferente dos sistemas transacionais. Enquanto nesses sistemas temos vários controles e updates de registros, no DW temos somente inserts e selects de dados. Por exemplo, num sistema de contabilidade podemos fazer alterações nos registros. Já no DW, o que acontece é somente ler os dados na origem e gravá-los no destino, ou seja, no banco modelado multidimensional.

As características do Data Warehouse levam a um ambiente que é muito diferente dos ambientes operacionais clássicos. Como a fonte de quase todos os dados do Data Warehouse é o ambiente operacional, é sempre uma tentação pensar que existe uma redundância maciça do dados entre este ambiente o e Data Warehouse. Deve-se considerar os seguintes fatos:

*Os dados são filtrados a medida que passam de um ambiente para o outro
*O horizonte de tempo de dados é muito diferente do ambiente operacional para o Data Warehouse
*O Data Warehouse possui dados resumidos os quais não são encontrados no ambiente operacional
*Os dados sofrem uma transformação fundamental na medida em que passam para o Data Warehouse.

Localização
Os dados podem estar fisicamente armazenados de três formas:

Num único local centralizando o banco de dados em um DW integrado, procurando maximizar o poder de processamento e agilizando a busca dos dados. Esse tipo de armazenagem é bastante utilizada, porém há o inconveniente do investimento em hardware para comportar a base de dados muito volumosa, e o poderio de processamento elevado para atender satisfatoriamente as consultas simultâneas de muitos usuários.

Os distribuídos são Data Marts, armazenados por áreas de interesse. Por exemplo, os dados da gerência financeira num servidor, dados de marketing noutro e dados da contabilidade num terceiro lugar. Essa pode ser uma saída interessante para quem precisa de bastante performance, pois isso não sobrecarrega um único servidor, e as consultas serão sempre atendidas em tempo satisfatório.

Armazenados por níveis de detalhes, em que as unidades de dados são mantidas no DW. Pode-se armazenar dados altamente resumidos num servidor, dados resumidos noutro nível de detalhe intermediário no segundo servidor e os dados mais detalhados (atômicos), num terceiro servidor. Os servidores da primeira camada podem ser otimizados para suportar um grande número de acessos e um baixo volume de dados, enquanto alguns servidores nas outras camadas podem ser adequados para processar grandes volumes de dados, mas baixo número de acesso.

Para mudar de nível é necessário que ocorra um dos seguintes eventos: os dados são sintetizados, arquivados ou eliminados.

O processo de sintetização interage no nível mais alto de detalhamento (dados detalhados atuais) para os níveis seguintes (levemente e altamente resumidos). Quando termina determinado período de tempo (semana, mês, trimestre, ano), os dados são indexados por estes períodos e armazenados nos seus respectivos níveis de detalhamento. Para facilitar o acesso aos dados, estes devem estar sintetizados e indexados de várias maneiras. Portanto, ao mesmo tempo que ocorre o agrupamento por datas, também pode ocorrer a sintetização por grupos e subgrupos.

Cada nível possui um horizonte de tempo definido para a permanência dos dados. Então o fato de os dados serem transportados para níveis mais elevados não implica na exclusão do nível anterior. Um processo denominado processo de envelhecimento ocorre quando este limite é ultrapassado, e portanto os dados podem ser transferidos para meios de armazenamentos alternativos ou passar de dados detalhados atuais para dados detalhados antigos.

Credibilidade dos Dados
A credibilidade dos dados é o muito importante para o sucesso de qualquer projeto. Discrepâncias simples de todo tipo podem causar sérios problemas quando se quer extrair dados para suportar decisões estratégicas para o negócio das empresas. Dados não dignos de confiança podem resultar em relatório inúteis, que não têm importância alguma, assim como uma lista de pacientes do sexo masculino e grávidos, por exemplo.


Granularidade
Granularidade nada mais é do que o nível de detalhe ou de resumo dos dados existentes num DW. Quanto maior for o nível de detalhes, menor será o nível de granularidade. O nível de granularidade afeta diretamente o volume de dados armazenados no DW, e ao mesmo tempo o tipo de consulta que pode ser respondida.

Fontes:
http://www.dwbrasil.com.br/html/artdw_carac.html (principal)
http://pt.wikipedia.org/wiki/Data_Warehouse
http://www.dei.unicap.br/~almir/seminarios/98.2/DataWareHouse/dw.html

quarta-feira, 26 de setembro de 2007

Mindomo


Olha pessoal que eu achei: um editor de mapas online Mindomo(http://www.mindomo.com/).

Achei ele muito parecido do MindManager que eu já uso do desenvovimento do meus mapas. Esse tem a vantagem de se compartilhar não apenas o mapa pronto, mas o próprio desenvolvimento.

E viva a web 2.0!!

DirAdministrativo - 8112 - Provimento

terça-feira, 25 de setembro de 2007

segunda-feira, 24 de setembro de 2007

DirConstitucional - Remédios Constitucionais


Esse mapa mental faz parte do ebook de Direito Constitucional.

Mais informações sobre esse e outros ebooks de mapas mentais consulte www.mapasequestoes.com.br

DirAdministrativo - Parte Geral




Parte Geral

DirTributário - Espécies de tributos




Tributos que constam simultanemanente na CF e CTN.

UML - Relacionamentos



Fontes:
http://www.dga.unicamp.br/treinamento/apostilas/apostila_uml.pdf
http://www.macoratti.net/vb_uml2.htm

http://forumconcurseiros.com/phpbb2/viewtopic.php?t=15669&start=0&postdays=0&postorder=asc&

http://www.forumconcurseiros.com/phpbb2/viewtopic.php?t=4984&start=25

domingo, 23 de setembro de 2007

Português-Verbos

Para variar um pouco, uma mapa básico de português. Como conjugação é assunto muito recorrente, para alguns verbos, é bom ter a conjugação completa na ponta da língua.

Sites que me ajudam muito em português.
Dicionário:http://www.priberam.pt/
Conjugador: Site conjugador: http://linguistica.insite.com.br/cgi-bin/conjugue
Gramática:http://www.portugues.com.br/



-------------------------------------------------

3. Na construção de uma das opções abaixo foi empregada uma forma verbal que segue o mesmo tipo de uso do verbo haver em "Houve muitos esforços meritórios para superar esse impasse." (l. 20-21). Indique-a.

a- O antropólogo já havia observado a atitude dos grupos sociais.

b- Na época da publicação choveram elogios aos livros.

c- Faz muito tempo da publicação de livros como estes.

d- No futuro, todos hão de reconhecer o seu valor.

e- Não se fazem mais brasileiros como antigamente.


Comentário:

"Houve muitos esforços meritórios para superar esse impasse": Pretério perfeito do indicativo.

a, b) Pretério IMperfeito do indicativo.

c) impessoal, no sentido de tempo decorrido. Não marquei essa, mas é a resposta certa.

d)Futuro

e) Presente do indicativo


Gab: C

UML - Diagramas



------------------------------------------------------------------------

(AnalistaLegislativo) 3. Características de um sistema que não mudam com o tempo podem ser representadas, na UML 2.0, por meio de um diagrama de

a - máquina de estados.

b - casos de uso.

c - atividades.

d - seqüência.

e - implantação.

Comentário: casos de uso, atividades e seqüência são diagramas dinâmico.
Diagramas estáticos: Implantação



Gab-E

sábado, 22 de setembro de 2007

RISC X CISC





Estou tentando seguir o programa da maioria dos concurso de TI. Então, mais um pouco de Arquitetura de Computadores.

Agora um assunto muito recorrente: RISC X CISC.
A maior parte dos comentário desse mapa foi tirado de questões de prova.

------------------------------------------------
Na Arquitetura RISC,

a) as instruções geradas pelos compiladores são armazenadas na memória ROM e para serem executadas na CPU devem ser inicialmente interpretadas pelos microprogramas.

b) as instruções são interpretadas por microprogramas e posteriormente armazenadas na CPU.

c) as instruções, na sua maioria, necessitam de mais de um ciclo de máquina para serem executadas.

d) o código gerado pelos compiladores é constituído de instruções complexas, armazenados na memória EPROM.

e) as instruções geradas pelos compiladores são armazenadas na memória RAM.


Comentários:
Esse assunto não é muito forte, mas vamos lá.
a) Risc não usa interpretação.
b) idem 'a'
c) Tinha marcado essa, pois como são ciclos reduzidos, achei que teria que ter ciclos. Exemplo: para 2 x 3, teria q fazer 2 + 2 + 2. Mas está errado.
d) instruções Complexa são CISC
e) resposta certa

Gab.: E
------------------------------------------------------
Mais mapas mentias consulte www.mapasequestoes.com.br

quinta-feira, 20 de setembro de 2007

001 Arquitetura - hardware




Recomeçando a estudar para concursos ná área de TI, vou postar um mapa de um assunto chatinho para quem 'debandou' para área de sistemas: Arquitetura de computadores.



Fiz o resumo consulta sites, wikpedia. Um liks mais relavantes foram:
http://www.lerparaver.com/informatica/hardware.htm
http://www.las.ic.unicamp.br/edmar/PUC/2006/AC/AC-Aula9.pdf


----------------------------------------------------------------------
Questões sobre esse assunto:
(Sefaz/CE-2007)
31- Considere a organização, a arquitetura e os componentes
funcionais de computadores e assinale a opção correta.

a) As linhas de um barramento são classifi cadas em três
grupos, de acordo com a sua função: de dados, de
endereços e de controle. Cada linha pode conduzir
apenas 1 byte por vez, sendo assim, o número de linhas
total defi ne quantos bytes podem ser transferidos por
vez.
b) A temporização de um barramento defi ne o modo
por meio do qual os eventos nesse barramento são
coordenados. Na transmissão assíncrona, a ocorrência
de eventos é determinada por um relógio – que define
um intervalo de tempo.
c) A entrada/saída programada trata interrupções para
transferências entre a memória e a entrada/saída por
meio do processador.
d) O tempo de ciclo de memória compreende o tempo de
acesso e o tempo adicional requisitado antes de um
próximo acesso ser iniciado – sendo uma defi nição
aplicada principalmente a memórias de acesso
aleatório.
e) A relação entre o tamanho (em bits) de um endereço
de memória T e o número de unidades endereçáveis
N é N = 2 x T (duas vezes T)

---------comentários-----
a) casca de banana: não 1 byte, é 1 BIT.

b) a temporização é que define a sincronização.

c) -

d) -

e) A formula correta N = 2 ^ T (2 elevaddo a T)





Gab: D

quarta-feira, 19 de setembro de 2007

Quem somos...

Esse blog foi criado com intuito de compartilhar conhecimento através de mapas mentais e questões dos mais diversos assuntos.

Cometário, sugestões, correções são muito bem vindos.

A imagens podem ser copiadas livremente para impressão ou publicação em outros sites, apenas peço que indiquem a fonte.

Tradutor/Translate

web counter