Arquivo da Categoria ‘Data Mining’

Conheça o KNIME Team Space – Compartilhe seu trabalho

segunda-feira, 7 de maio de 2012


O KNIME agora pode ser usado em uma equipe e o trabalho pode ser compartilhado. Os usuários KNIME podem se beneficiar dos esforços de todos os outros colegas de trabalho, mantendo os arquivos de dados em conjunto com fluxos de trabalho de análise de dados em um local central compartilhado.  Os metanodes podem ser utilizados localmente e sempre estarão sincronizados com a versão original. Dê uma olhada em KNIME Team Space – uma extensão para KNIME desktop para compartilhar o seu trabalho.




O KNIME Team Space estende os dados do seu KNIME Desktop para a plataforma de análise e oferece uma funcionalidade sustentável e compartilhável para o uso profissional.


Fonte: www.knime.com

Experiências utilizando SAS e R em bancos

segunda-feira, 16 de abril de 2012



Assista o vídeo abaixo com o palestrante Hong Ooi (mestrado em Applied Stats da Macquarie em 1997, e doutorado em estatísticas da ANU de 2000-2004). Fala sobre alguns dos projectos mais interessantes que ele usou R no último ano. Incluindo modelos de ajuste para a perda de hipoteca em caso de inadimplência, a Monte Carlo para carteiras de aplicação de teste de esforço de empréstimo (em combinação com Excel e SAS), um quadro para o cálculo through-the-probabilidades [econômico-] Ciclo de inadimplência, e possivelmente outros. Ele também fala sobre alguns dos desafios envolvidos na obtenção de R aceito em um local de trabalho instituição financeira conservadora:



Fonte: www.vcasmo.com

Veja como Deloitte utiliza R para análise atuarial

segunda-feira, 2 de abril de 2012



Agradecemos Jim Guszcza (chumbo Predictive Analytics na Deloitte Consulting e professor assistente na Universidade de Wisconsin-Madison), que fez uma grande apresentação sobre análise atuarial com R via web.
É comum muitos profissionais utilizarem o Excel para fazerem seus cálculos, no entanto esta ferramenta possui um número limitado de modelos matemáticos e estatísticos.
Nessa demonstração, Jim apresenta um exemplo de como utilizar o R para cálculos atuariais:





Utilizando o KNIME, as possibilidades de modelos que podem ser aplicados aumentam. Além da automatização dos processo e relatórios em um ambiente friendly.
Conheça a versão open clicando aqui.


Fonte: www.revolutionalanalytics.com

Dados revelam efeitos colaterais de drogas sorrateiras

segunda-feira, 19 de março de 2012



Mineração de dados de vigilância destaca milhares de consequências desconhecidas quando as drogas são tomadas em conjunto.


Um algoritmo projetado por cientistas norte-americanos de arrasto através de uma infinidade de interações medicamentosas rendeu milhares de efeitos colaterais previamente desconhecidos causados ​​por drogas em combinação.


O trabalho, publicado hoje na Science Translational Medicine, fornece uma maneira de classificar através das centenas de milhares de ‘eventos adversos “, relatou para a Alimentação e Medicamentos dos EUA (FDA) a cada ano.“É um passo na direção de um catálogo completo de interações medicamentosas”, diz o autor principal do estudo, Russ Altman, um bioengenheiro da Universidade de Stanford, na Califórnia.


Embora os ensaios clínicos são geralmente desenhados para avaliar a segurança de uma droga, além de como ele funciona bem, o tamanho dos ensaios para detectar a gama de interações medicamentosas superaria até mesmo os grandes, em estágio final de testes clínicos, por vezes, necessários para a aprovação da droga. Além disso, os ensaios clínicos são muitas vezes feito em ambientes controlados, utilizando critérios cuidadosamente definidos para determinar quais pacientes são elegíveis para inscrição – incluindo outras condições que possam dizer quais são os medicamentos que possam ser ingeridos  juntamente com a droga em estudo.


Fonte: www.nature.com

KNIME 2012 Reunião do Grupo de Usuário

segunda-feira, 5 de março de 2012



Mais de 130 fãs KNIME reuniram-se para a 5 ª reunião do grupo Usuário KNIME realizada nos dias 01 e 02 de fevereiro de 2012 em Zurique. Os participantes representaram uma ampla gama de indústrias, incluindo vários segmentos, desde a ciência da vida através do varejo, telecomunicações e bancário para entretenimento e governo. Além de uma boa olhada no que está acontecendo em KNIME.com AG e software KNIME, houve dois dias de excelentes apresentações por clientes e parceiros. Dois destaques incluídos Mike Hoskins da Pervasive, um dos líderes em Processamento de Dados Big e um parceiro KNIME integrada, destacando não só o desafio que Big Data traz para as organizações, mas como a combinação KNIME / Pervasive aborda o desafio. O dia terminou com uma sessão inédita dada por Kilian Thiel e Koetter Tobias, Konstanz Uni, e Phil Winters, KNIME, que combinava tanto de mineração de textos e análise de rede de dados de mídia social feito na plataforma open source KNIME para produzir acionável. Nova percepção de que nunca tinha sido visto antes. A próxima Reunião do Grupo de Usuário KNIME está agendada para06 e 07 marco de 2013 em Zurique, na Suíça. Marque em seus calendários!





Equipe KNIME.


Fonte: www.knime.org

KNIME Version 2.5.1 released & upcoming User Group Meeting in Zurich

segunda-feira, 9 de janeiro de 2012



Dear KNIME User,


We have released a new version of KNIME which adds improvements related to the use of node annotations and at the same time fixes a few minor, non-critical bugs. A detailed list of what has been fixed can be found here.


Please also note that the early bird registration deadline for our upcoming user group meeting ends on January 15, 2012. However, we recommend making your travel and accommodation arrangements as soon as possible as hotel space close to the meeting site is limited!


KNIME Desktop 2.5.1 can be downloaded from the download page or you can upgrade your existing KNIME installation by using the built-in update functionality available in the “File” menu (or “Help” in the developer version).


The 5th KNIME Users Group Meeting will take place in Zurich, Switzerland between January 30 and February 3, 2012. Similar to last year, the UGM is accompanied by a two-day KNIME user and reporting training program as well as special workshops from KNIME and the KNIME Partners on Friday.


Fonte: www.knime.org

KNIME PMML Support: Model Import and Export + Pre-processing

segunda-feira, 12 de dezembro de 2011



What is KNIME? According to knime.com:


KNIME (Konstanz Information Miner) is a user-friendly and comprehensive open-source data integration, processing, analysis, and exploration platform.


Yes, KNIME is user-friendly, not only because it offers an intuitive GUI to analyze data, but also because it is open-source. KNIME is also standards friendly. KNIME 2.0 released in 2008 was the first release to offer PMML support. PMML, the Predictive Model Markup Language, is the de facto standard to represent data mining and predictive analytic models. PMML today is supported by all the top statistical packages, including SAS, IBM SPSS, KXEN, and R.


Since release 2.0, PMML support in KNIME has matured considerably, from the import and export of predictive models all the way to the pre-processing of input variables. KNIME 2.5, released December 01, 2011 offers a series of PMML-enabled pre-processing nodes which can be embedded automatically in the final PMML model. All these features are documented in a paper presented at the KDD 2011 PMML Workshop:


Peer-reviewed article: KDD 2011 – PMML Pre-processing in KNIME

To illustrate some of KNIME capabilities when it comes to PMML, we describe below a workflow we built in KNIME for training a neural network model for classification of the audit data set. This workflow encapsulates the following high-level tasks:

  • The reading in of the audit data set (this data set is supplied as part of the R Rattle package): This is an artificial data set consisting of fictional clients who have been audited, perhaps for tax refund compliance. For each case an outcome is recorded: whether the taxpayer’s claims had to be adjusted or not which in the data is represented by 0 (no) and 1 (yes).
  • The pre-processing of input variables, which involves dummyfication of categorical variables and normalization of numerical variables
  • The training and testing of a neural network model
  • The exporting of the resulting PMML file which includes all pre-processing steps as well as the neural network model itself.



KNIME Workflow – Step-by-Step

Below we describe in 8 steps how we went around building such a workflow.


Step 1: We start by reading the audit data set from a csv file. We simply use node “CSV Reader” for that. We then use node “Number To String” to tell KNIME that our predicted variable “TARGET_Adjusted” should be treated as a string.




Step 2: Since we do not want to use all variables in the data set for training our neural network, we use the node “Column Filter” to filter out variables such as ID and IGNORE_Accounts.




Step 3: We are now ready to start massaging the remaining data. For that we use the new PMML-enabled node “One2Many” to create dummy variables out of the categorical raw input variables. Note that this node comes with a blue port indicating its PMML capabilities. We also use another “Column Filter” node to remove the original categorical variables from our data.



Step 4: We then add PMML-enabled node “Normalizer” to the workflow. This node normalizes all the numerical variables so that they can be presented to the neural network for training. Note that we linked the blue port from the preceding node to this node. This signals KNIME that we would like to have the PMML representation passed between nodes.




Step 5: We then use the node “Partitioning” to partition the audit data into two data sets, one for training and another for testing.




Step 6: We can now use node “RProp MLP Learner” to train our neural network model. Note that this node is also PMML-enabled and so we link the blue port from node “Normalizer” to it. This ensures that the PMML equivalent of the pre-processing operations are being passed to the neural net learner node.




Step 7: Given that the neural network has been trained, it is time to export the resulting PMML file. For that we use the node “PMML Writer”. You can inspect the exported PMML file on your own (see RESOURCES below).




Step 8: As far as PMML is concerned, we are done. But, to complete the model building process, we must evaluate our model against the test data. For that, we connect the test piece of node “Partitioning” to node “MultiLayerPerceptron Predictor”. Note that the trained neural network model is communicated from the learner node to the predictor node via a blue PMML port. Finally, we can then visualize the scoring results using node “Interactive Table”. With this step, our data workflow is complete.




Putting your model to work


Once you have you verified that the model works and that it generalizes over the testing data, you can simply upload the resulting PMML file into ADAPA where it will be made available for execution.


Resources


Learn


Get products and technologies


KNIME, a user-friendly and comprehensive open-source data integration, processing, analysis, and exploration platform. From day one, KNIME has been developed using rigorous software engineering practices and is used by professionals in both industry and academia in over 60 countries.


Fonte: www.adapasupport.zementis.com

Guia prático do KNIME para usuários SAS

terça-feira, 8 de novembro de 2011

O Guia foi escrito para atender as crescentes solicitações feitas por usuários SAS  que desejam aprender mais rapidamente o KNIME.
Este material compara ambas ferramentas e possibilita que usuários SAS vertam as suas implementações para o KNIME.


 

Baixe gratuitamente este material.  -written by Rosaria Silipo.


Conheça também os conceitos básicos do KNIME,  disponível

gratuitamente no capitulo 1 do livro:

 KNIME Beginner’s Luck - A Guide to KNIME Data Mining Software for Beginners.


A universidade de Standford oferece cursos on line gratuitos.

segunda-feira, 12 de setembro de 2011



Você não pode perder essa oportunidade:


1. Introdução a inteligência artificial: Inteligência Artificial é a ciência de fazer um software de computador dar razões sobre o mundo ao seu redor. Como  robôs humanóides, google googles, carros que dirigem sozinhos , mesmo software que sugere que a música que você gostaria de ouvir são exemplos de AI. Nesta aula, você vai aprender como criar esse software a partir de dois dos líderes no campo. Para maiores informações, clique aqui.



2. Introdução a base de dados: Este curso abrange a concepção de banco de dados e o uso de sistemas de gerenciamento de banco de dados para aplicações. Ele inclui uma ampla cobertura do modelo relacional, álgebra relacional e SQL. Para maiores informações, clique aqui.



3. Machine learning: Este curso fornece uma introdução ampla à aprendizagem de máquina, datamining e reconhecimento de padrões estatísticos. Confira aqui.



Fonte:http://spectrum.ieee.org

Exporte e converta os modelos do R para PMML com o KNIME.

terça-feira, 9 de agosto de 2011



A partir da versão KNIME 2.0, é possível importar (v3.0, v3.1, v3.2) e exportar (v3.1) modelos PMML dentro e fora do KNIME. O leitor e escritor de PMML  pode ser encontrado na categoria IO.  Você tem a opção de usar o R com o KNIME, neste caso será necessário baixar o plugin R para KNIME. Caso você não tem o R instalado, você deverá baixar o R, que está disponível no site do KNIME update. Este plugin do R, já contém o pacote da aplicação PMML. Assim que tudo estiver instalado, será possível usar um modelo do R através do nó Learner R da categoria local R.  A imagem abaixo mostra um exemplo:



A exportação do objeto R gerado pode ser feito de duas maneiras:

1. O objeto R é convertido para PMML diretamente com o código R, ou

2. O objeto R é passado para a porta de saída, em seguida, convertido pelo nó conversor do build-in R-to-PMML. Ele pode ser escrito para o arquivo pelo nó Escritor PMML.


Fonte: www.knime.org/blog