博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
使用jpmml-sparkml-executable生成PMML模型文件
阅读量:6938 次
发布时间:2019-06-27

本文共 916 字,大约阅读时间需要 3 分钟。

hot3.png

加载依赖的jar包通过./spark-shell  --jars ./jpmml-sparkml-executable-1.2.13.jar 启动spark
import org.apache.spark.ml.classification.LogisticRegressionimport org.apache.spark.ml.feature.VectorAssemblerimport org.apache.spark.ml.Pipelineimport org.apache.spark.ml.PipelineStageimport org.apache.spark.ml.feature.RFormulaimport org.jpmml.sparkml.PMMLBuilderimport java.io.Fileval df = (spark.read.format("csv")  .option("sep", ",")  .option("inferSchema", "true")  .option("header", "true")  .load("/user/spark/security/Wholesale_customers_data.csv"))    val formula = new RFormula().setFormula("target ~ .")val lr = new LogisticRegression()val pipeline = new Pipeline().setStages(Array(formula,lr))  val schema = df.schemaval pipelineModel = pipeline.fit(df)val pmml = new PMMLBuilder(schema, pipelineModel)val file = pmml.buildFile(new File("/data/data2/tmp/logit_pipeline.pmml"))

转载于:https://my.oschina.net/kyo4321/blog/2878932

你可能感兴趣的文章
Jquery 实现 微博,消息向上滚动
查看>>
Redis(一)——NoSQL入门和概述
查看>>
我为什么不看好 PHP 发展 ?
查看>>
使用jquery jcrop插件进行图片的截取与保存
查看>>
Spring Boot学习笔记-MVC
查看>>
Java身份证号码验证
查看>>
利用docker搭建php7和nginx运行环境的全过程
查看>>
C语言中的const和指针
查看>>
SpringMVC3.0.5+Spring3.0.5+MyBatis3.0.4全注解实例详解(一)
查看>>
[有效]Hibernate之deleted object would be re-saved by cascade 异常的解决
查看>>
MongoDB 更新文档
查看>>
JavaScript创建对象(六)——寄生构造函数模式
查看>>
用C#创建Windows服务(Windows Services)
查看>>
C++ 指针的算术运算
查看>>
golang客户端sarama通过SSL连接Kafka配置
查看>>
SpringBoot之Admin监控系统
查看>>
javaweb Servlet开发
查看>>
电信网络拓扑图自动布局之曲线布局
查看>>
Netty源码分析 服务器端1
查看>>
Activity之生命周期
查看>>