Dear KNIME User,
We have released a new version of KNIME which adds improvements related to the use of node annotations and at the same time fixes a few minor, non-critical bugs. A detailed list of what has been fixed can be found here.
Please also note that the early bird registration deadline for our upcoming user group meeting ends on January 15, 2012. However, we recommend making your travel and accommodation arrangements as soon as possible as hotel space close to the meeting site is limited!
KNIME Desktop 2.5.1 can be downloaded from the download page or you can upgrade your existing KNIME installation by using the built-in update functionality available in the “File” menu (or “Help” in the developer version).
The 5th KNIME Users Group Meeting will take place in Zurich, Switzerland between January 30 and February 3, 2012. Similar to last year, the UGM is accompanied by a two-day KNIME user and reporting training program as well as special workshops from KNIME and the KNIME Partners on Friday.
Fonte: www.knime.org
Arquivo da Categoria ‘Data Mining’
KNIME Version 2.5.1 released & upcoming User Group Meeting in Zurich
segunda-feira, 9 de janeiro de 2012KNIME PMML Support: Model Import and Export + Pre-processing
segunda-feira, 12 de dezembro de 2011
What is KNIME? According to knime.com:
KNIME (Konstanz Information Miner) is a user-friendly and comprehensive open-source data integration, processing, analysis, and exploration platform.
Yes, KNIME is user-friendly, not only because it offers an intuitive GUI to analyze data, but also because it is open-source. KNIME is also standards friendly. KNIME 2.0 released in 2008 was the first release to offer PMML support. PMML, the Predictive Model Markup Language, is the de facto standard to represent data mining and predictive analytic models. PMML today is supported by all the top statistical packages, including SAS, IBM SPSS, KXEN, and R.
Since release 2.0, PMML support in KNIME has matured considerably, from the import and export of predictive models all the way to the pre-processing of input variables. KNIME 2.5, released December 01, 2011 offers a series of PMML-enabled pre-processing nodes which can be embedded automatically in the final PMML model. All these features are documented in a paper presented at the KDD 2011 PMML Workshop:
Peer-reviewed article: KDD 2011 – PMML Pre-processing in KNIME
To illustrate some of KNIME capabilities when it comes to PMML, we describe below a workflow we built in KNIME for training a neural network model for classification of the audit data set. This workflow encapsulates the following high-level tasks:
- The reading in of the audit data set (this data set is supplied as part of the R Rattle package): This is an artificial data set consisting of fictional clients who have been audited, perhaps for tax refund compliance. For each case an outcome is recorded: whether the taxpayer’s claims had to be adjusted or not which in the data is represented by 0 (no) and 1 (yes).
- The pre-processing of input variables, which involves dummyfication of categorical variables and normalization of numerical variables
- The training and testing of a neural network model
- The exporting of the resulting PMML file which includes all pre-processing steps as well as the neural network model itself.
KNIME Workflow – Step-by-Step
Below we describe in 8 steps how we went around building such a workflow.
Step 1: We start by reading the audit data set from a csv file. We simply use node “CSV Reader” for that. We then use node “Number To String” to tell KNIME that our predicted variable “TARGET_Adjusted” should be treated as a string.

Step 2: Since we do not want to use all variables in the data set for training our neural network, we use the node “Column Filter” to filter out variables such as ID and IGNORE_Accounts.

Step 3: We are now ready to start massaging the remaining data. For that we use the new PMML-enabled node “One2Many” to create dummy variables out of the categorical raw input variables. Note that this node comes with a blue port indicating its PMML capabilities. We also use another “Column Filter” node to remove the original categorical variables from our data.

Step 4: We then add PMML-enabled node “Normalizer” to the workflow. This node normalizes all the numerical variables so that they can be presented to the neural network for training. Note that we linked the blue port from the preceding node to this node. This signals KNIME that we would like to have the PMML representation passed between nodes.

Step 5: We then use the node “Partitioning” to partition the audit data into two data sets, one for training and another for testing.

Step 6: We can now use node “RProp MLP Learner” to train our neural network model. Note that this node is also PMML-enabled and so we link the blue port from node “Normalizer” to it. This ensures that the PMML equivalent of the pre-processing operations are being passed to the neural net learner node.

Step 7: Given that the neural network has been trained, it is time to export the resulting PMML file. For that we use the node “PMML Writer”. You can inspect the exported PMML file on your own (see RESOURCES below).

Step 8: As far as PMML is concerned, we are done. But, to complete the model building process, we must evaluate our model against the test data. For that, we connect the test piece of node “Partitioning” to node “MultiLayerPerceptron Predictor”. Note that the trained neural network model is communicated from the learner node to the predictor node via a blue PMML port. Finally, we can then visualize the scoring results using node “Interactive Table”. With this step, our data workflow is complete.

Putting your model to work
Once you have you verified that the model works and that it generalizes over the testing data, you can simply upload the resulting PMML file into ADAPA where it will be made available for execution.
Resources
Learn
- Download the resulting PMML file (KNIME export), audit data set, and KNIME workflow for this example.
- Read the article published in the KDD 2011 PMML Workshop: PMML Pre-processing in KNIME.
- Read the white-paper Zementis and KNIME published together: Social Media, Recommendation Engines and Real-Time Model Execution with KNIME and ADAPA
- Visit the Zementis PMML Resources page to explore complete PMML examples.
- Join the PMML discussion group in LinkedIn.
- Export and Convert R models to PMML with KNIME.
Get products and technologies
KNIME, a user-friendly and comprehensive open-source data integration, processing, analysis, and exploration platform. From day one, KNIME has been developed using rigorous software engineering practices and is used by professionals in both industry and academia in over 60 countries.
Fonte: www.adapasupport.zementis.com
Guia prático do KNIME para usuários SAS
terça-feira, 8 de novembro de 2011O Guia foi escrito para atender as crescentes solicitações feitas por usuários SAS que desejam aprender mais rapidamente o KNIME.
Este material compara ambas ferramentas e possibilita que usuários SAS vertam as suas implementações para o KNIME.
Baixe gratuitamente este material. -written by Rosaria Silipo.
Conheça também os conceitos básicos do KNIME, disponível
gratuitamente no capitulo 1 do livro:
KNIME Beginner’s Luck - A Guide to KNIME Data Mining Software for Beginners.
A universidade de Standford oferece cursos on line gratuitos.
segunda-feira, 12 de setembro de 2011
Você não pode perder essa oportunidade:
1. Introdução a inteligência artificial: Inteligência Artificial é a ciência de fazer um software de computador dar razões sobre o mundo ao seu redor. Como robôs humanóides, google googles, carros que dirigem sozinhos , mesmo software que sugere que a música que você gostaria de ouvir são exemplos de AI. Nesta aula, você vai aprender como criar esse software a partir de dois dos líderes no campo. Para maiores informações, clique aqui.

2. Introdução a base de dados: Este curso abrange a concepção de banco de dados e o uso de sistemas de gerenciamento de banco de dados para aplicações. Ele inclui uma ampla cobertura do modelo relacional, álgebra relacional e SQL. Para maiores informações, clique aqui.

3. Machine learning: Este curso fornece uma introdução ampla à aprendizagem de máquina, datamining e reconhecimento de padrões estatísticos. Confira aqui.

Fonte:http://spectrum.ieee.org
Exporte e converta os modelos do R para PMML com o KNIME.
terça-feira, 9 de agosto de 2011
A partir da versão KNIME 2.0, é possível importar (v3.0, v3.1, v3.2) e exportar (v3.1) modelos PMML dentro e fora do KNIME. O leitor e escritor de PMML pode ser encontrado na categoria IO. Você tem a opção de usar o R com o KNIME, neste caso será necessário baixar o plugin R para KNIME. Caso você não tem o R instalado, você deverá baixar o R, que está disponível no site do KNIME update. Este plugin do R, já contém o pacote da aplicação PMML. Assim que tudo estiver instalado, será possível usar um modelo do R através do nó Learner R da categoria local R. A imagem abaixo mostra um exemplo:

A exportação do objeto R gerado pode ser feito de duas maneiras:
1. O objeto R é convertido para PMML diretamente com o código R, ou
2. O objeto R é passado para a porta de saída, em seguida, convertido pelo nó conversor do build-in R-to-PMML. Ele pode ser escrito para o arquivo pelo nó Escritor PMML.
Fonte: www.knime.org/blog
Conheça a nova versão, KNIME versão 2.3!
quinta-feira, 16 de dezembro de 2010
A Estanislao como parceira da KNIME.COM no Brasil, com entusiasmo apresenta as novas funcionalidades da versão 2.3:
• Criação da Community repository contendo novas extensões:
- Ambiente com diversos recursos para R-scripting.
- Pprocessamento de imagem
- Bioinformática.
• Inserir os resultados das análises do R diretamente nos relatórios;
• Novas funcionalidades para conexão com banco de dados e R-Nodes;
• Capacidade de exportação dos workflows como SVG Graphics.
• Novas funcionalidades que facilitam a utilização do KNIME:
- Novas teclas de atalho
- Inserir anotações nos fluxo de trabalho
- Opção para ocultar rótulos dos nós
Experimente gratuitamente!
Para obter maiores informações sobre os produtos KNIME, clique aqui.
KNIME-Apresenta o maior crescimento do número de usuários, dentre as ferramentas de Data Mining.
quarta-feira, 13 de outubro de 2010O KNIME, segundo a pesquisa desenvolvida pela KDnuggets, foi à ferramenta que apresentou o maior crescimento no número de usuários em 2010, com um aumento de 288% em relação a 2009. Este crescimento foi superior aos obtidos pelas principais ferramentas de Data Mining.
Alguns resultados da pesquisa, comparando o número de usuários de 2010 em relação a 2009, foram:
- Softwares que apresentaram crescimento no número de usuários:
- KNIME: crescimento de 288% (4,9% para 19,2%)
- Statsoft-Statistica: crescimento 184% (2,2% para 6,3% )
- R: crescimento de 113% (14,0% para 29,8%)
- RapidMiner crescimento de 79% (21,2% para 37,8%)
- Excel: crescimento de 30% (18.7% para 24.3%)
- Softwares que decresceram no número de usuários:
- IBM SPSS – Clementine: decréscimo de -78% (33,0% para 7.3%)
- SAS Enterprise Miner decréscimo -70%(18.4% para 5.5%)
Para ver a pesquisa completa acesse o site da KDnuggets
Web Analytics no KNIME
quarta-feira, 13 de outubro de 2010
As empresas de hoje sabem que a Internet é extremamente importante para apoiar as ações de MKT. Ações estas, que visam fortalecer e dar visibilidade a marca, entender o posicionamento no mercado e aumentar o número de vendas.
Dada esta importância, é fundamental que os gestores tenham acesso a relatórios com informações relevantes provenientes da internet. E o Web analytics é o processo que tem como finalidade atender a esta demanda.
Para se desenvolver Web Analyticss é necessário utilizar ferramentas que possibilitem extrair, analisar estatisticamente e gerar relatórios, das informações provenientes da web.
O KNIME possui um excelente módulo analítico para desenvolver Web Analytics.
Através de um ambiente amigável, este módulo possibilita o desenvolvimento de todo o processo de analytics de forma eficiente.
O módulo para desenvolver Web Analytics esta disponível na versão open-source do KNIME.
Lançamento do KNIME v2.2.2
quinta-feira, 30 de setembro de 2010
Lançamento da nova versão do KNIME Desktop e o KNIME Reporting.
Nesta nova versão, v2.2.2, foram realizadas diversas melhorias em ambos os módulos.
Caso ainda não conheça, baixe gratuitamente e experimente duas excelentes plataformas para desenvolver análise de dados e gerar relatórios gerenciais.
Para obter maiores informações sobre os produtos clique aqui e sobre a KNIME.com GmbH visite www.KNIME.com

