重庆分公司,新征程启航
为企业提供网站建设、域名注册、服务器等服务
这类基础逻辑编程初学可以手写逻辑,这个基本如下:
成都创新互联-专业网站定制、快速模板网站建设、高性价比锡山网站开发、企业建站全套包干低至880元,成熟完善的模板库,直接使用。一站式锡山网站制作公司更省心,省钱,快速模板网站建设找我们,业务覆盖锡山地区。费用合理售后完善,十年实体公司更值得信赖。
载入基础信息(Excel地址)
###手动指定###
获取输入查询数据
###input()获取,保存指变量###
打开Excel文件
####使用openpyxl打开,获取工作簿对象和表对象####
获取excel有效行与列数据
### 可以函数判断,最好手工写非空判断获取####
遍历返回结果数据
### 读取每个单元格 查询字符串即可,习惯用Count还是find函数看具体需求和习惯###
写入文件
同样可以采用openpyxl写入excel或者直接写入txt文件
#导入thrift和habse包
from thrift import Thrift
from thrift.transport import TSocket
from thrift.transport import TTransport
from thrift.protocol import TBinaryProtocol
from hbase import Hbase
from hbase.ttypes import *
#此处可以修改地址和端口
host = '192.168.1.1'
#默认端口为9090
port = 9090
#要查询的表名
table = 'table_name'
#定义一个过滤器,此为关键步骤
filter = "RowFilter(=,'regexstring:.3333.')" #此行原创:)
# Make socket
transport = TSocket.TSocket(host, port)
# Buffering is critical. Raw sockets are very slow
# 还可以用TFramedTransport,也是高效传输方式
transport = TTransport.TBufferedTransport(transport)
# Wrap in a protocol
#传输协议和传输过程是分离的,可以支持多协议
protocol = TBinaryProtocol.TBinaryProtocol(transport)
#客户端代表一个用户
client = Hbase.Client(protocol)
#打开连接
try:
transport.open()
scan.filterString=filter
scanner = client.scannerOpenWithScan(table, scan)
except Exception:
finally:
client.scannerClose(scan)
transport.close()
连接代码网上一搜一大堆,非原创,来源已不可考,非本人研究成果;
关键就是这个:"RowFilter(=,'regexstring:.3333.')"
这个过滤器要写对,hbase有十几种内置的过滤器方法,有几种比较运算符和比较器,上面这个是正则方式,即'regexstring:.3333.';
过滤器整个双引号里面的内容会通过thrift传给hbase服务端处理,下划线这部分正则要支持java的正则要求不然会报错
字符串有个function叫startswith
根据你的内容我提供一段代码
for str in list:
if str.startswith('a'):
print "found it!",str
楼主测试下哈,我用的是2.x。
有问题再联系我~~蟒蛇小组祝您编程愉快!