Arquivo da Categoria ‘Software Estatístico’

Experiências utilizando SAS e R em bancos

segunda-feira, 16 de abril de 2012



Assista o vídeo abaixo com o palestrante Hong Ooi (mestrado em Applied Stats da Macquarie em 1997, e doutorado em estatísticas da ANU de 2000-2004). Fala sobre alguns dos projectos mais interessantes que ele usou R no último ano. Incluindo modelos de ajuste para a perda de hipoteca em caso de inadimplência, a Monte Carlo para carteiras de aplicação de teste de esforço de empréstimo (em combinação com Excel e SAS), um quadro para o cálculo through-the-probabilidades [econômico-] Ciclo de inadimplência, e possivelmente outros. Ele também fala sobre alguns dos desafios envolvidos na obtenção de R aceito em um local de trabalho instituição financeira conservadora:



Fonte: www.vcasmo.com

Veja como Deloitte utiliza R para análise atuarial

segunda-feira, 2 de abril de 2012



Agradecemos Jim Guszcza (chumbo Predictive Analytics na Deloitte Consulting e professor assistente na Universidade de Wisconsin-Madison), que fez uma grande apresentação sobre análise atuarial com R via web.
É comum muitos profissionais utilizarem o Excel para fazerem seus cálculos, no entanto esta ferramenta possui um número limitado de modelos matemáticos e estatísticos.
Nessa demonstração, Jim apresenta um exemplo de como utilizar o R para cálculos atuariais:





Utilizando o KNIME, as possibilidades de modelos que podem ser aplicados aumentam. Além da automatização dos processo e relatórios em um ambiente friendly.
Conheça a versão open clicando aqui.


Fonte: www.revolutionalanalytics.com

KNIME 2012 Reunião do Grupo de Usuário

segunda-feira, 5 de março de 2012



Mais de 130 fãs KNIME reuniram-se para a 5 ª reunião do grupo Usuário KNIME realizada nos dias 01 e 02 de fevereiro de 2012 em Zurique. Os participantes representaram uma ampla gama de indústrias, incluindo vários segmentos, desde a ciência da vida através do varejo, telecomunicações e bancário para entretenimento e governo. Além de uma boa olhada no que está acontecendo em KNIME.com AG e software KNIME, houve dois dias de excelentes apresentações por clientes e parceiros. Dois destaques incluídos Mike Hoskins da Pervasive, um dos líderes em Processamento de Dados Big e um parceiro KNIME integrada, destacando não só o desafio que Big Data traz para as organizações, mas como a combinação KNIME / Pervasive aborda o desafio. O dia terminou com uma sessão inédita dada por Kilian Thiel e Koetter Tobias, Konstanz Uni, e Phil Winters, KNIME, que combinava tanto de mineração de textos e análise de rede de dados de mídia social feito na plataforma open source KNIME para produzir acionável. Nova percepção de que nunca tinha sido visto antes. A próxima Reunião do Grupo de Usuário KNIME está agendada para06 e 07 marco de 2013 em Zurique, na Suíça. Marque em seus calendários!





Equipe KNIME.


Fonte: www.knime.org

KNIME Version 2.5.1 released & upcoming User Group Meeting in Zurich

segunda-feira, 9 de janeiro de 2012



Dear KNIME User,


We have released a new version of KNIME which adds improvements related to the use of node annotations and at the same time fixes a few minor, non-critical bugs. A detailed list of what has been fixed can be found here.


Please also note that the early bird registration deadline for our upcoming user group meeting ends on January 15, 2012. However, we recommend making your travel and accommodation arrangements as soon as possible as hotel space close to the meeting site is limited!


KNIME Desktop 2.5.1 can be downloaded from the download page or you can upgrade your existing KNIME installation by using the built-in update functionality available in the “File” menu (or “Help” in the developer version).


The 5th KNIME Users Group Meeting will take place in Zurich, Switzerland between January 30 and February 3, 2012. Similar to last year, the UGM is accompanied by a two-day KNIME user and reporting training program as well as special workshops from KNIME and the KNIME Partners on Friday.


Fonte: www.knime.org

KNIME PMML Support: Model Import and Export + Pre-processing

segunda-feira, 12 de dezembro de 2011



What is KNIME? According to knime.com:


KNIME (Konstanz Information Miner) is a user-friendly and comprehensive open-source data integration, processing, analysis, and exploration platform.


Yes, KNIME is user-friendly, not only because it offers an intuitive GUI to analyze data, but also because it is open-source. KNIME is also standards friendly. KNIME 2.0 released in 2008 was the first release to offer PMML support. PMML, the Predictive Model Markup Language, is the de facto standard to represent data mining and predictive analytic models. PMML today is supported by all the top statistical packages, including SAS, IBM SPSS, KXEN, and R.


Since release 2.0, PMML support in KNIME has matured considerably, from the import and export of predictive models all the way to the pre-processing of input variables. KNIME 2.5, released December 01, 2011 offers a series of PMML-enabled pre-processing nodes which can be embedded automatically in the final PMML model. All these features are documented in a paper presented at the KDD 2011 PMML Workshop:


Peer-reviewed article: KDD 2011 – PMML Pre-processing in KNIME

To illustrate some of KNIME capabilities when it comes to PMML, we describe below a workflow we built in KNIME for training a neural network model for classification of the audit data set. This workflow encapsulates the following high-level tasks:

  • The reading in of the audit data set (this data set is supplied as part of the R Rattle package): This is an artificial data set consisting of fictional clients who have been audited, perhaps for tax refund compliance. For each case an outcome is recorded: whether the taxpayer’s claims had to be adjusted or not which in the data is represented by 0 (no) and 1 (yes).
  • The pre-processing of input variables, which involves dummyfication of categorical variables and normalization of numerical variables
  • The training and testing of a neural network model
  • The exporting of the resulting PMML file which includes all pre-processing steps as well as the neural network model itself.



KNIME Workflow – Step-by-Step

Below we describe in 8 steps how we went around building such a workflow.


Step 1: We start by reading the audit data set from a csv file. We simply use node “CSV Reader” for that. We then use node “Number To String” to tell KNIME that our predicted variable “TARGET_Adjusted” should be treated as a string.




Step 2: Since we do not want to use all variables in the data set for training our neural network, we use the node “Column Filter” to filter out variables such as ID and IGNORE_Accounts.




Step 3: We are now ready to start massaging the remaining data. For that we use the new PMML-enabled node “One2Many” to create dummy variables out of the categorical raw input variables. Note that this node comes with a blue port indicating its PMML capabilities. We also use another “Column Filter” node to remove the original categorical variables from our data.



Step 4: We then add PMML-enabled node “Normalizer” to the workflow. This node normalizes all the numerical variables so that they can be presented to the neural network for training. Note that we linked the blue port from the preceding node to this node. This signals KNIME that we would like to have the PMML representation passed between nodes.




Step 5: We then use the node “Partitioning” to partition the audit data into two data sets, one for training and another for testing.




Step 6: We can now use node “RProp MLP Learner” to train our neural network model. Note that this node is also PMML-enabled and so we link the blue port from node “Normalizer” to it. This ensures that the PMML equivalent of the pre-processing operations are being passed to the neural net learner node.




Step 7: Given that the neural network has been trained, it is time to export the resulting PMML file. For that we use the node “PMML Writer”. You can inspect the exported PMML file on your own (see RESOURCES below).




Step 8: As far as PMML is concerned, we are done. But, to complete the model building process, we must evaluate our model against the test data. For that, we connect the test piece of node “Partitioning” to node “MultiLayerPerceptron Predictor”. Note that the trained neural network model is communicated from the learner node to the predictor node via a blue PMML port. Finally, we can then visualize the scoring results using node “Interactive Table”. With this step, our data workflow is complete.




Putting your model to work


Once you have you verified that the model works and that it generalizes over the testing data, you can simply upload the resulting PMML file into ADAPA where it will be made available for execution.


Resources


Learn


Get products and technologies


KNIME, a user-friendly and comprehensive open-source data integration, processing, analysis, and exploration platform. From day one, KNIME has been developed using rigorous software engineering practices and is used by professionals in both industry and academia in over 60 countries.


Fonte: www.adapasupport.zementis.com

Guia prático do KNIME para usuários SAS

terça-feira, 8 de novembro de 2011

O Guia foi escrito para atender as crescentes solicitações feitas por usuários SAS  que desejam aprender mais rapidamente o KNIME.
Este material compara ambas ferramentas e possibilita que usuários SAS vertam as suas implementações para o KNIME.


 

Baixe gratuitamente este material.  -written by Rosaria Silipo.


Conheça também os conceitos básicos do KNIME,  disponível

gratuitamente no capitulo 1 do livro:

 KNIME Beginner’s Luck - A Guide to KNIME Data Mining Software for Beginners.


Agora é possível ler data sets do SAS a partir do KNIME

domingo, 25 de setembro de 2011


Com a nova versão do KNIME (KNIME 2.4) agora é possível ler base de dados do  SAS, com apenas um clique.


KNIME Labs desenvolveu um nó dedicado para leitura de dados do SAS, “.SAS7BDAT “.   Este nó pertence ao KNIME Labs, para instalar esta extensão, basta seguir os seguintes passos.

Para instalar o KNIME Labs:

- Baixe e instale o KNIME

- Clique no menu “Help”
- Selecione “Install New Software …”
- Selecione o update site, como: http://www.knime.org/update/2.4
- Abra a categoria “KNIME Labs Extensions”
- Selecionae “KNIME SAS7BDATA Reader (Windows Only)”
- Clique “Next” e siga as instruções de intalação.

Conheça e baixe o KNIME.

Exporte e converta os modelos do R para PMML com o KNIME.

terça-feira, 9 de agosto de 2011



A partir da versão KNIME 2.0, é possível importar (v3.0, v3.1, v3.2) e exportar (v3.1) modelos PMML dentro e fora do KNIME. O leitor e escritor de PMML  pode ser encontrado na categoria IO.  Você tem a opção de usar o R com o KNIME, neste caso será necessário baixar o plugin R para KNIME. Caso você não tem o R instalado, você deverá baixar o R, que está disponível no site do KNIME update. Este plugin do R, já contém o pacote da aplicação PMML. Assim que tudo estiver instalado, será possível usar um modelo do R através do nó Learner R da categoria local R.  A imagem abaixo mostra um exemplo:



A exportação do objeto R gerado pode ser feito de duas maneiras:

1. O objeto R é convertido para PMML diretamente com o código R, ou

2. O objeto R é passado para a porta de saída, em seguida, convertido pelo nó conversor do build-in R-to-PMML. Ele pode ser escrito para o arquivo pelo nó Escritor PMML.


Fonte: www.knime.org/blog

GO GREEN GO CLOUD!

segunda-feira, 1 de agosto de 2011



Um estudo recente sobre as vantagens econômicas e ambientais da computação de cloud tem sido conduzido pelo Carbon Disclosure Project, divulgando que é “a solução de TI para a século XXI”. Focando um conjunto de dados de 11 empresas multinacionais (MNCs). Através de uma gama de indústrias diferentes, o projeto buscou calcular o impacto potencial da mudança para uma infra-estrutura de cloud.
Depois de entrevistar os departamentos que já implementou uma solução de cloud o relatório descobriu que cinco vantagens eram comuns:

- Melhora de tempo no mercado
- Economia de custo mais elevado
- Capex (up-front de investimento de capital) para Opex (investimento operacional)
- Flexibilidade
- Automação

Com os dados do MNCs, um modelo econômico foi construído para mostrar o que as economias de implementar uma solução de cloud poderia ser mais de 2.653 empresas com receita de US $ 1 bilhão ou mais em funcionamento os EUA.
Eles usaram este modelo para previsão de que, hipoteticamente, a implantação da economia de energia de cloud poderia ter um grande impacto econômico para essas empresas, potencialmente economizando US $ 12.3billion por ano até 2020.

Modelo derivado de poupança de energia líquida 2011-2020:

Além disso, o modelo previu que isso iria reduzir as emissões de carbono por 85.7 milhões toneladas métricas por ano até 2020, equivalente às emissões anuais de veículos de passageiros 16.8 milhões.

Modelo derivado de poupança líquida de CO² 2011-2020:

O estudo é mais uma prova de que a mudança para uma solução em cloud não só faz sentido econômico, mas também significa que você está contribuindo para o planeta!

Fonte: www.wearecloud.com

INOVAÇÕES KNIME

segunda-feira, 18 de julho de 2011



O KNIME acaba de lançar KNIME v2.4, uma liberação de recursos com um monte de novas funcionalidades e algumas correções de bugs. Os destaques desta versão são:

  • Melhorias em torno de manipulação de meta nó (colapso / expansão e diálogos personalizados);
  • Melhorias de usabilidade (por exemplo:  layout automático, inserção nó rapidamentecom um duplo-clique);
  • Execução do loop polido (por exemplo:  a execução do loop paralelo disponível a partir de laboratórios);
  • Melhor PMML processamento (pré-processamento acrescentou PMML, que também será apresentado na conferência deste ano KDD);
  • Muitos novos nós, incluindo todo um conjunto de nós de processamento XML,tabulação cruzada e nós para pré-processamento de dados e mineração de dados, incluindo métodos de aprendizado conjunto.



Uma lista detalhada das mudanças pode ser encontrada aqui: http://tech.knime.org/changelog-v240. O KNIME desktop v2.4 pode ser baixado através do site:  http: /www.knime.org / / download ou você pode atualizar seu KNIME v2 .3. x  usando a funcionalidade de atualização built-in disponível no menu “Arquivo”(ou ”Help” na versão de desenvolvimento).

Gostaríamos de aproveitar esta oportunidade para lembrá-lo de nossa próxima Oficina de Ciência KNIME Vida, que está acontecendo em San Francisco em 28 de julho de 2011. É um workshop gratuito onde você pode conhecer as pessoas por trás KNIME e os parceiros ciência KNIME vida. A agenda preliminar está disponível em: http://www.knime.org/LifeScienceDay2011

KNIME é o único open-source ferramenta de análise que tem sido desenvolvido desde o primeiro dia usando rigorosos processos de engenharia de software profissional em conjunto com tecnologia de ponta expertise de análise de dados de um grupo deuniversitários. KNIME.com, localizada em Zurique, na Suíça, com distribuidores eparceiros na Europa, EUA, Brasil, China, Japão e oferece consultoria e treinamentopara a plataforma KNIME além de uma gama crescente de produtos da empresa (Report Server, Enterprise Server e KNIME Execução Cluster) eo Report Designer livreKNIME. Visite www.KNIME.com para mais informações.