命令行

我们感动!为了改善客户体验,Collibra数据质量用户指南已转移到亚愽视频 亚愽视频Collibra文档中心 作为Collibra数据质量2亚愽视频022.11版本的一部分。为了确保平稳过渡, dq-docs.亚愽视频collibra.com 仍然可以访问,但DQ用户指南现在只在文档中心进行维护。

规模+数据科学

规模与数据科学的结合。通过添加执行器和/或内存来线性扩展数据
-f "file:///Users/home/salary_data.csv" \
-d "," \
-rd "2018-01-08" \
- ds“salary_data”
-numexecutors 2 \
-executormemory 2 g

纱的主人

如果Owl运行在流行的hadoop发行版(如HDP、CDH、EMR)的边缘节点上,它将自动向Yarn资源管理器注册作业。

火花的主人

Owl也可以通过使用-master输入并传入spark:url来运行spark master

独立的火花

Owl大多数情况下可以独立运行,但自然不会将处理分布到激活它的硬件之外。
选项
描述
deploymode
Spark部署模式选项
drivermemory
驱动内存示例3G为本地空间
executorcores
火花执行器核心
executormemory
spark执行器内存选项示例3G
覆盖本地[*],即spark://myhost:7077, yarn-client, yarn-cluster
sparkprinc
Kerberos主体名ex:(电子邮件保护)

直接绕过OwlCheck使用Spark-Submit

spark-submit
——driver-class-path / opt / / postgres42 / postgresql-42.2.4.jar owl /驱动程序
——driver-library-path / opt / / postgres42 / postgresql-42.2.4.jar owl /驱动程序
——驱动内存3g——num-executor2——executor-memory 1克
——主火花:/ / Kirks-MBP.home: 7077
——class com.owl.core.cli.OwlCheck /opt/owl/bin/owl-core-trunk-jar-with-dependencies.jar
-u user -p pass -c jdbc:postgresql://xyz.chzid9w0hpyi.us-east-1.rds.amazonaws.com/postgres
-ds accounts -rd2019-05 -dssafeoff -q“select * from accounts”
-driver org.postgresql.Driver -lib /opt/owl/drivers/postgres42/

并行JDBC Spark-Submit

spark-submit
——driver-class-path / opt / / postgres42 / postgresql-42.2.4.jar owl /驱动程序
——driver-library-path / opt / / postgres42 / postgresql-42.2.4.jar owl /驱动程序
——配置spark.driver.extraJavaOptions-Dlog4j.configurationfile:///opt/owl/config/log4j-TRACE.properties
——配置spark.executor.extraJavaOptions-Dlog4j.configurationfile:///opt/owl/config/log4j-TRACE.properties
——文件/ opt /猫头鹰/ config / log4j-TRACE.properties
——driver-memory 2g——num-executors2——executor-memory 1g——master spark:// kirks - mmb .home:7077
——class com.owl.core.cli.OwlCheck /opt/owl/bin/owl-core-trunk-jar-with-dependencies.jar
-u us -p pass -c jdbc:postgresql://xyz.chzid9w0hpyi.us-east-1.rds.amazonaws.com/postgres
-ds aumdt -rd2019-05 -dssafeoff -q"select * from aum_dt"
-driver org.postgresql.Driver -lib /opt/owl/drivers/postgres42/
-connectionpropsfetchsize6000主火花:/ / Kirks-MBP.home: 7077
- corff -histoff -statsoff
-columnname updt_ts -numpartitions .使用实例4下界1557597987353-upperbound1557597999947