[找] 技夥伴(精通爬/料/AI/全端)|能力及合作方式正文|可端|利合作 - V2EX
首页
注册
登录
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请
登录
V2EX
创业组队
[找] 技夥伴(精通爬/料/AI/全端)|能力及合作方式正文|可端|利合作
luckypoem
4 天前
191 次点击
合作目(系共有部分): ●圈客行部分: (1) 台地(第一段)之「商」取「台地」及「外」之目客,之行。 (2) 大地(第二段加入之目)之「外商」取「外」之目客,之行。 ●口碑行部分: (1) 台地(第一段)之「商」出合意及有效之容,提供消者 GoogleMap 、FB 、IG 、小、TikTok 等五平台出。 (2) 大地(第二段加入之目)之「商」出合意及有效之容,提供消者小、TikTok 等平台出。
估:第一段估年人民 5000 以上,第二段保守估年人民 2 元以上。
合作酬(以承揽及前提): (1) 每月利分配:月利之 20%。 (2) 用:完成前 50 行用 2 元人民(廓、重、注意部分,大致已清楚)。 (3) 前後端系 ONCALL 及程式增修用:每月用人民 1 元。(期每月新增 3 行)
有能力及意向之夥伴或,留言。WeChat ID:wwa777778
(能力需求)按前端(B 端)及 AI 需求爬取及整 FB 、IG 、GOOGLEMAP 、官、amazon.....之容: ●核心技能: (1) Python 或其他爬相程式言,至少 2 年以上爬。 (2) 、重既有爬程式。 (3) 理解 HTTP Request / Response 制,能理登入、Headers 、Cookies 、反爬制等。 (4) 依有流程主行程式,立分析充,考已程式行化功能展。 (5) Web Scraping 框架工具,如 Scrapy 、BeautifulSoup 、Selenium 或 Puppeteer ,根需求合工具。 (6) 基於有程式行、整功能迭代,保系定性持改。 (7) 示警制、平台。 (8) FB/IG 自化建、能力。 (9) VPN 上技及本系反爬能力。 (10) 具全端程式及能力。 ●社交媒爬: (11) 爬取 Instagram 、Facebook 等社交平台文、短影音( Reels 、Stories 等)及相(如留言、按、分享)。
(12) 熟悉各大社交媒平台限制避技巧,保料抓取的定性合法性。 (13) 理( Javascript 渲染)反爬制(如 CAPTCHA 、IP 封)的挑。 (14) 以 GraphQL 取料。 ●WhatsApp: (15) 爬取 amazon 消者相料。 (16) 以 WhatsApp 送息至 messenger 。 ●以 FB 及 IG 取除 FB 及 IG 容外之「特定受群之及特性」。
(能力需求)自然言理( NLP )言,包括: ●意分析、向量( word embeddings )、境理解、法( Syntax )、( Semantics )、用( Pragmatics )。 ●有效用、上下文、格式化入影 AI 出。
(能力需求)AI 及大型言模型( LLM )知,包括: ●Transformer 、GPT 、BERT 等 LLM 的基本原理工作方式。 ●模型的限制(如幻、偏、不完整)以之 prompt 避免。 ●以 Zero-shot 、Few-shot Learning 等 prompt 技巧,提升 LLM 回的性。 ●Prompt 化技巧: (1) 精性( Precision ):以、明的言表需求。 (2) 上下文( Context Design ):提供量,保 AI 理解目。 (3) 束格式化( Constraints & Formatting ):要求特定出格式,如 JSON 、Markdown 、表格。 (4) ( A/B Testing ):不同 prompt ,找出最佳效果。 ●程式 API 整合: (1) Python 及各大公司 API / LangChain 等框架。 (2) 撰本(.sh )自化 prompt 分析 AI 出果。 (3) 使用正表式、文本理技巧提取 AI 生的容。
●料分析估: (1) 分析 AI 回的度、一致性、造性,找出最佳 prompt 模式。 (2) AB 比不同 prompt 的效果。 ●域知( Domain Knowledge ): (1) 不同用景(如程式生成、、法律、行、不同)整 Prompt 。 (2) 具 UX / UI 思,保 AI 出使用者有值。 ●版本控制作: (1) 有案合作,看得懂其他人案的程式。 (2) Git / GitHub 。 (3) HACKMD:技文件撰、度 ( Prompt 、流程) 、原最佳。 ●安全道德考量: (1) 保 Prompt 避免生有害容(如偏、假)。 (2) 解 AI 法道德,如歧、私保、容查。
(能力需求)料系、化、管理 (1) 式料(如 MySQL 、PostgreSQL )的用,料索引,大模料存查的化。 (2) 熟悉 Linux 境,部署排程( cron 、systemd 、Docker ,具 Kubernetes (k8s))。 (3) 高效的料索引,支援跨行、多的社交媒料存快速索。 (4) 料清理正化,保爬取料的一致性可用性。 (5) 管理管理料。
(能力需求)性技能其他要求 ●程式品文件:熟悉版本控制工具(如 Git ),撰乾、可的程式,保持的文件,保程式易於理解。 ●料私合性:深入了解料私法律(如 GDPR 、平台使用款),保爬行符合法要求,能在爬系考理法律束。 ●按既定程序架行:理解既定程序架需求,能密切合作,具良好的成能力。 ●理解需求其化技。 ●持技更新:新技社交平台 API 更新的保持敏感,持以快速化的爬境。 ●快速理解既有程式行、功能整、修及效能化。 ●Microsoft Azure 端服,在 Azure 境中部署展爬系,相工具(如 Azure Functions 、Azure Blob Storage )。 ●容器化技(如 Docker ),以支援爬系的部署管理。 ●料分析能力,爬取料行初步化理,方便後分析用。 ●版本控制控:Git / GitHub 程式版本管理&控日管理(如 Sentry 、ELK ,或可自控本)。
(能力需求)意思解能力&持研究: ●社交平台反爬制的化或料效能瓶。 ●能拆解,化 AI 可理解的入格式。 ●透迭代找到最有效的 Prompt 合。 ●思考如何 AI 生成更具意、符合需求的容。 ●跟 AI / NLP 最新技(如 OpenAI 布的新模型、文、第一手知道 Deepseek 消息等等)。 ●持化 Prompt ,以 AI 的步用需求。 ●查文研究解,秀的解能力。
目前尚无回复
爬
料
AI
关于
帮助文档
自助推广系统
博客
API
FAQ
Solana
4461 人在线
最高记录 6679
Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 39ms
UTC 08:30
PVG 16:30
LAX 00:30
JFK 03:30
Do have faith in what you're doing.
ubao
msn
snddm
index
pchome
yahoo
rakuten
mypaper
meadowduck
bidyahoo
youbao
zxmzxm
asda
bnvcg
cvbfg
dfscv
mmhjk
xxddc
yybgb
zznbn
ccubao
uaitu
acv
GXCV
ET
GDG
YH
FG
BCVB
FJFH
CBRE
CBC
GDG
ET54
WRWR
RWER
WREW
WRWER
RWER
SDG
EW
SF
DSFSF
fbbs
ubao
fhd
dfg
ewr
dg
df
ewwr
ewwr
et
ruyut
utut
dfg
fgd
gdfgt
etg
dfgt
dfgd
ert4
gd
fgg
wr
235
wer3
we
vsdf
sdf
gdf
ert
xcv
sdf
rwer
hfd
dfg
cvb
rwf
afb
dfh
jgh
bmn
lgh
rty
gfds
cxv
xcv
xcs
vdas
fdf
fgd
cv
sdf
tert
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
shasha9178
shasha9178
shasha9178
shasha9178
shasha9178
liflif2
liflif2
liflif2
liflif2
liflif2
liblib3
liblib3
liblib3
liblib3
liblib3
zhazha444
zhazha444
zhazha444
zhazha444
zhazha444
dende5
dende
denden
denden2
denden21
fenfen9
fenf619
fen619
fenfe9
fe619
sdf
sdf
sdf
sdf
sdf
zhazh90
zhazh0
zhaa50
zha90
zh590
zho
zhoz
zhozh
zhozho
zhozho2
lislis
lls95
lili95
lils5
liss9
sdf0ty987
sdft876
sdft9876
sdf09876
sd0t9876
sdf0ty98
sdf0976
sdf0ty986
sdf0ty96
sdf0t76
sdf0876
df0ty98
sf0t876
sd0ty76
sdy76
sdf76
sdf0t76
sdf0ty9
sdf0ty98
sdf0ty987
sdf0ty98
sdf6676
sdf876
sd876
sd876
sdf6
sdf6
sdf9876
sdf0t
sdf06
sdf0ty9776
sdf0ty9776
sdf0ty76
sdf8876
sdf0t
sd6
sdf06
s688876
sd688
sdf86