Github 30000 Star的免费BI工具Superset怎么用,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。
BI工具是数据分析的得力武器,目前市场上有很多BI软件,众所周知的有Tableau、PowerBI、Qlikview、帆软等,其中大部分是收费软件或者部分功能收费。这些工具一通百通,用好一个就够了,重要的是分析思维。
我一直用的Tableau,不过实在太贵,一年小一万。之前在github接触到一个基于浏览器的开源BI应用,名叫「Superset」,是Airbnb团队开发的。闲来无事就爱折腾,在安装Superset配置阶段用了一些时间,有点心累,不过实际用起来却是非常nice。
先看下面板效果:
它还可以和deck.gl集成,做高难度的地图展示:
Superset后端是基于python开发的,所以也算是python生态的一员。它的三大特点是:开源、轻量级、图表丰富。相比较集成好的软件,Superset是有些使用门槛的,对新手没那么友好,不过它免费呀,免费真香。
官方对Superset的介绍是:
- 通过 NVD3/D3 预定义了多种可视化图表,满足大部分的数据展示功能。;
- 一个轻量级的语义层,允许通过定义维度和度量来控制数据源如何向用户公开;
- 一个可扩展的、高粒度的安全模型,允许复杂的规则对谁可以访问哪些产品特征和数据集。与主要身份验证后端集成(数据库、OpenID、LDAP、OAuth、REMOTE_USER、…);
- 通过SQLAlchemy与大多数基于SQL语言的RDBMS集成;
有一个亮点,Superset支持sql查询,这太方便了,Tableau似乎不可以。使用SQL Lab查询和可视化数据:
你可以导入csv等文本文件,并连接数据库。Superset支持的数据库:
MySQL
Oracle
PostgreSQL
Presto
Snowflake
SQLite
SQLServer
Teradata
Vertica
Hana
AmazonAthena
AmazonRedshift
ApacheDrill
ApacheDruid
ApacheHive
ApacheImpala
ApacheKylin
ApachePinot
ApacheSparkSQL
BigQuery
ClickHouse
CockroachDB
Dremio
Elasticsearch
Exasol
GoogleSheets
Greenplum
IBMDb2
不过要连接这些数据库,需要安装相应的连接包:
自由选择多种图表类型:
更加丰富的案例:
Superset的python依赖库比较多,建议先安装Anaconda,避免不必要的麻烦。
具体安装使用步骤见下:
#Installsuperset
pipinstallapache-superset
#Initializethedatabase
supersetdbupgrade
#Createanadminuser(youwillbepromptedtosetausername,firstandlastnamebeforesettingapassword)
$exportFLASK_APP=superset
supersetfabcreate-admin
#Loadsomedatatoplaywith
supersetload_examples
#Createdefaultrolesandpermissions
supersetinit
#Tostartadevelopmentwebserveronport8088,use-ptobindtoanotherport
supersetrun-p8088--with-threads--reload--debugger
在实际安装使用过程可能会遇到各种各样的麻烦,所以多问问Google吧,或者stackoverflow。
看完上述内容,你们掌握Github 30000 Star的免费BI工具Superset怎么用的方法了吗?如果还想学到更多技能或想了解更多相关内容,欢迎关注恰卡编程网行业资讯频道,感谢各位的阅读!