Dear KNIME User,
We have released a new version of KNIME which adds improvements related to the use of node annotations and at the same time fixes a few minor, non-critical bugs. A detailed list of what has been fixed can be found here.
Please also note that the early bird registration deadline for our upcoming user group meeting ends on January 15, 2012. However, we recommend making your travel and accommodation arrangements as soon as possible as hotel space close to the meeting site is limited!
KNIME Desktop 2.5.1 can be downloaded from the download page or you can upgrade your existing KNIME installation by using the built-in update functionality available in the “File” menu (or “Help” in the developer version).
The 5th KNIME Users Group Meeting will take place in Zurich, Switzerland between January 30 and February 3, 2012. Similar to last year, the UGM is accompanied by a two-day KNIME user and reporting training program as well as special workshops from KNIME and the KNIME Partners on Friday.
Fonte: www.knime.org
Arquivo da Categoria ‘Software Estatístico’
KNIME Version 2.5.1 released & upcoming User Group Meeting in Zurich
segunda-feira, 9 de janeiro de 2012KNIME PMML Support: Model Import and Export + Pre-processing
segunda-feira, 12 de dezembro de 2011
What is KNIME? According to knime.com:
KNIME (Konstanz Information Miner) is a user-friendly and comprehensive open-source data integration, processing, analysis, and exploration platform.
Yes, KNIME is user-friendly, not only because it offers an intuitive GUI to analyze data, but also because it is open-source. KNIME is also standards friendly. KNIME 2.0 released in 2008 was the first release to offer PMML support. PMML, the Predictive Model Markup Language, is the de facto standard to represent data mining and predictive analytic models. PMML today is supported by all the top statistical packages, including SAS, IBM SPSS, KXEN, and R.
Since release 2.0, PMML support in KNIME has matured considerably, from the import and export of predictive models all the way to the pre-processing of input variables. KNIME 2.5, released December 01, 2011 offers a series of PMML-enabled pre-processing nodes which can be embedded automatically in the final PMML model. All these features are documented in a paper presented at the KDD 2011 PMML Workshop:
Peer-reviewed article: KDD 2011 – PMML Pre-processing in KNIME
To illustrate some of KNIME capabilities when it comes to PMML, we describe below a workflow we built in KNIME for training a neural network model for classification of the audit data set. This workflow encapsulates the following high-level tasks:
- The reading in of the audit data set (this data set is supplied as part of the R Rattle package): This is an artificial data set consisting of fictional clients who have been audited, perhaps for tax refund compliance. For each case an outcome is recorded: whether the taxpayer’s claims had to be adjusted or not which in the data is represented by 0 (no) and 1 (yes).
- The pre-processing of input variables, which involves dummyfication of categorical variables and normalization of numerical variables
- The training and testing of a neural network model
- The exporting of the resulting PMML file which includes all pre-processing steps as well as the neural network model itself.
KNIME Workflow – Step-by-Step
Below we describe in 8 steps how we went around building such a workflow.
Step 1: We start by reading the audit data set from a csv file. We simply use node “CSV Reader” for that. We then use node “Number To String” to tell KNIME that our predicted variable “TARGET_Adjusted” should be treated as a string.

Step 2: Since we do not want to use all variables in the data set for training our neural network, we use the node “Column Filter” to filter out variables such as ID and IGNORE_Accounts.

Step 3: We are now ready to start massaging the remaining data. For that we use the new PMML-enabled node “One2Many” to create dummy variables out of the categorical raw input variables. Note that this node comes with a blue port indicating its PMML capabilities. We also use another “Column Filter” node to remove the original categorical variables from our data.

Step 4: We then add PMML-enabled node “Normalizer” to the workflow. This node normalizes all the numerical variables so that they can be presented to the neural network for training. Note that we linked the blue port from the preceding node to this node. This signals KNIME that we would like to have the PMML representation passed between nodes.

Step 5: We then use the node “Partitioning” to partition the audit data into two data sets, one for training and another for testing.

Step 6: We can now use node “RProp MLP Learner” to train our neural network model. Note that this node is also PMML-enabled and so we link the blue port from node “Normalizer” to it. This ensures that the PMML equivalent of the pre-processing operations are being passed to the neural net learner node.

Step 7: Given that the neural network has been trained, it is time to export the resulting PMML file. For that we use the node “PMML Writer”. You can inspect the exported PMML file on your own (see RESOURCES below).

Step 8: As far as PMML is concerned, we are done. But, to complete the model building process, we must evaluate our model against the test data. For that, we connect the test piece of node “Partitioning” to node “MultiLayerPerceptron Predictor”. Note that the trained neural network model is communicated from the learner node to the predictor node via a blue PMML port. Finally, we can then visualize the scoring results using node “Interactive Table”. With this step, our data workflow is complete.

Putting your model to work
Once you have you verified that the model works and that it generalizes over the testing data, you can simply upload the resulting PMML file into ADAPA where it will be made available for execution.
Resources
Learn
- Download the resulting PMML file (KNIME export), audit data set, and KNIME workflow for this example.
- Read the article published in the KDD 2011 PMML Workshop: PMML Pre-processing in KNIME.
- Read the white-paper Zementis and KNIME published together: Social Media, Recommendation Engines and Real-Time Model Execution with KNIME and ADAPA
- Visit the Zementis PMML Resources page to explore complete PMML examples.
- Join the PMML discussion group in LinkedIn.
- Export and Convert R models to PMML with KNIME.
Get products and technologies
KNIME, a user-friendly and comprehensive open-source data integration, processing, analysis, and exploration platform. From day one, KNIME has been developed using rigorous software engineering practices and is used by professionals in both industry and academia in over 60 countries.
Fonte: www.adapasupport.zementis.com
Guia prático do KNIME para usuários SAS
terça-feira, 8 de novembro de 2011O Guia foi escrito para atender as crescentes solicitações feitas por usuários SAS que desejam aprender mais rapidamente o KNIME.
Este material compara ambas ferramentas e possibilita que usuários SAS vertam as suas implementações para o KNIME.
Baixe gratuitamente este material. -written by Rosaria Silipo.
Conheça também os conceitos básicos do KNIME, disponível
gratuitamente no capitulo 1 do livro:
KNIME Beginner’s Luck - A Guide to KNIME Data Mining Software for Beginners.
Agora é possível ler data sets do SAS a partir do KNIME
domingo, 25 de setembro de 2011
Com a nova versão do KNIME (KNIME 2.4) agora é possível ler base de dados do SAS, com apenas um clique.
KNIME Labs desenvolveu um nó dedicado para leitura de dados do SAS, “.SAS7BDAT “. Este nó pertence ao KNIME Labs, para instalar esta extensão, basta seguir os seguintes passos.
Para instalar o KNIME Labs:
- Clique no menu “Help”
- Selecione “Install New Software …”
- Selecione o update site, como: http://www.knime.org/update/2.4
- Abra a categoria “KNIME Labs Extensions”
- Selecionae “KNIME SAS7BDATA Reader (Windows Only)”
- Clique “Next” e siga as instruções de intalação.
Conheça e baixe o KNIME.
Exporte e converta os modelos do R para PMML com o KNIME.
terça-feira, 9 de agosto de 2011
A partir da versão KNIME 2.0, é possível importar (v3.0, v3.1, v3.2) e exportar (v3.1) modelos PMML dentro e fora do KNIME. O leitor e escritor de PMML pode ser encontrado na categoria IO. Você tem a opção de usar o R com o KNIME, neste caso será necessário baixar o plugin R para KNIME. Caso você não tem o R instalado, você deverá baixar o R, que está disponível no site do KNIME update. Este plugin do R, já contém o pacote da aplicação PMML. Assim que tudo estiver instalado, será possível usar um modelo do R através do nó Learner R da categoria local R. A imagem abaixo mostra um exemplo:

A exportação do objeto R gerado pode ser feito de duas maneiras:
1. O objeto R é convertido para PMML diretamente com o código R, ou
2. O objeto R é passado para a porta de saída, em seguida, convertido pelo nó conversor do build-in R-to-PMML. Ele pode ser escrito para o arquivo pelo nó Escritor PMML.
Fonte: www.knime.org/blog
GO GREEN GO CLOUD!
segunda-feira, 1 de agosto de 2011
Um estudo recente sobre as vantagens econômicas e ambientais da computação de cloud tem sido conduzido pelo Carbon Disclosure Project, divulgando que é “a solução de TI para a século XXI”. Focando um conjunto de dados de 11 empresas multinacionais (MNCs). Através de uma gama de indústrias diferentes, o projeto buscou calcular o impacto potencial da mudança para uma infra-estrutura de cloud.
Depois de entrevistar os departamentos que já implementou uma solução de cloud o relatório descobriu que cinco vantagens eram comuns:
- Melhora de tempo no mercado
- Economia de custo mais elevado
- Capex (up-front de investimento de capital) para Opex (investimento operacional)
- Flexibilidade
- Automação
Com os dados do MNCs, um modelo econômico foi construído para mostrar o que as economias de implementar uma solução de cloud poderia ser mais de 2.653 empresas com receita de US $ 1 bilhão ou mais em funcionamento os EUA.
Eles usaram este modelo para previsão de que, hipoteticamente, a implantação da economia de energia de cloud poderia ter um grande impacto econômico para essas empresas, potencialmente economizando US $ 12.3billion por ano até 2020.
Modelo derivado de poupança de energia líquida 2011-2020:

Além disso, o modelo previu que isso iria reduzir as emissões de carbono por 85.7 milhões toneladas métricas por ano até 2020, equivalente às emissões anuais de veículos de passageiros 16.8 milhões.
Modelo derivado de poupança líquida de CO² 2011-2020:

O estudo é mais uma prova de que a mudança para uma solução em cloud não só faz sentido econômico, mas também significa que você está contribuindo para o planeta!
Fonte: www.wearecloud.com
INOVAÇÕES KNIME
segunda-feira, 18 de julho de 2011
O KNIME acaba de lançar KNIME v2.4, uma liberação de recursos com um monte de novas funcionalidades e algumas correções de bugs. Os destaques desta versão são:
- Melhorias em torno de manipulação de meta nó (colapso / expansão e diálogos personalizados);
- Melhorias de usabilidade (por exemplo: layout automático, inserção nó rapidamentecom um duplo-clique);
- Execução do loop polido (por exemplo: a execução do loop paralelo disponível a partir de laboratórios);
- Melhor PMML processamento (pré-processamento acrescentou PMML, que também será apresentado na conferência deste ano KDD);
- Muitos novos nós, incluindo todo um conjunto de nós de processamento XML,tabulação cruzada e nós para pré-processamento de dados e mineração de dados, incluindo métodos de aprendizado conjunto.
Uma lista detalhada das mudanças pode ser encontrada aqui: http://tech.knime.org/changelog-v240. O KNIME desktop v2.4 pode ser baixado através do site: http: /www.knime.org / / download ou você pode atualizar seu KNIME v2 .3. x usando a funcionalidade de atualização built-in disponível no menu “Arquivo”(ou ”Help” na versão de desenvolvimento).
Gostaríamos de aproveitar esta oportunidade para lembrá-lo de nossa próxima Oficina de Ciência KNIME Vida, que está acontecendo em San Francisco em 28 de julho de 2011. É um workshop gratuito onde você pode conhecer as pessoas por trás KNIME e os parceiros ciência KNIME vida. A agenda preliminar está disponível em: http://www.knime.org/LifeScienceDay2011
KNIME é o único open-source ferramenta de análise que tem sido desenvolvido desde o primeiro dia usando rigorosos processos de engenharia de software profissional em conjunto com tecnologia de ponta expertise de análise de dados de um grupo deuniversitários. KNIME.com, localizada em Zurique, na Suíça, com distribuidores eparceiros na Europa, EUA, Brasil, China, Japão e oferece consultoria e treinamentopara a plataforma KNIME além de uma gama crescente de produtos da empresa (Report Server, Enterprise Server e KNIME Execução Cluster) eo Report Designer livreKNIME. Visite www.KNIME.com para mais informações.
BIME comunica parceria com a Estanislao.
sexta-feira, 24 de junho de 2011
Meet our partners in Brazil, South Africa and Mexico
Our latest partners are:
- Estanislao Consulting from Brazil,
- The Global House of Accountants from South Africa, and
- Zinergia present in Mexico, Panama, Colombia, Chile, Argentina, Honduras and El Salvador
Cloud BI initiatives are multiplying. Our 3 new partners boast diverse client portfolios who have many specific needs (BPM, enterprise strategy, financial and accounting expertise etc.) for corporate online BI that has no global barriers. It will meet the internal needs of mobile managerial teams that wish to be able to generate ad hoc analyses from their internal data sources even when on the move, as well as external needs for teams that need to share dynamic reports online with clients and suppliers.
Read more about our partners here
Case de Sucesso do KNIME na Novartis.
quarta-feira, 25 de maio de 2011“Estamos muito impressionados com o nosso primeiro trabalho com o KNIME. Ser capaz de satisfazer as necessidades dos nossos diferentes tipos de usuários a partir de uma plataforma moderna é muito importante e nos propicia um grande sucesso”. Andy Palmer - Global Head of Software and Database Engineering Novartis
Saiba mais detalhes a respeito deste Case e aproveite para ler outras novidades no KNIME Newsletter de Abril de 2011.


