Browse parent directory
2025-04-09
# सॉफ़्टवेयर को एक प्रयोग के रूप में देखना
सॉफ़्टवेयर बनाने के आम उद्देश्यों में पैसा कमाना, लोगों का ध्यान आकर्षित करना और उन्हें उनकी समस्या हल करने के लिए उपकरण देना शामिल है।
मुझे एहसास हुआ कि मैं सॉफ़्टवेयर किसी और मकसद से बना रहा हूँ – वास्तविकता के बारे में धारणाएँ (हाइपोथीसिस) परखने के लिए, ताकि वास्तविकता से संपर्क हो सके।
- मैंने "libgen सर्च" प्रोजेक्ट मुख्य रूप से शोधकर्ताओं की मदद करने या खुद पैसे कमाने के लिए नहीं लिखा। बल्कि, मैं यह देखना चाहता था कि क्या इसे बनाना संभव है या नहीं। क्या कोई एआई मुझे ऐसी किताबें सुझा सकता है जो मैं खुद नहीं ढूँढ पाता? मुझे इसका जवाब मिला कि हाँ, एआई ऐसी किताबें सुझा सकता है जो उपयोगी हैं और जिन्हें मैं अन्यथा नहीं खोज पाता। एआई मेरी ज्ञान-प्रणाली (एपिस्टेमोलॉजी) बेहतर बना सकता है।
- इसी तरह, मैं जानना चाहता था कि क्या वर्तमान में वर्जित या वाद-विवाद वाले विषयों पर सच्चाई की खोज के लिए सर्च टूल का इस्तेमाल संभव है या नहीं। इसलिए मैंने रेडिट सर्च टूल बनाया। मुझे इससे गूगल में "site:reddit.com" लिखकर सर्च करने के मुकाबले ज्यादा बेहतर जवाब नहीं मिले। हालांकि, सच कहूँ तो गूगल में रेडिट पोस्ट ढूँढना ही इतना है कि इन वर्जित विषयों पर आगे बढ़ने का रास्ता मिल जाता है।
- मैं जानना चाहता था कि क्या LLM आधारित शैली-पहचान (स्टाइलोमेट्रिक) से किसी की असली पहचान उजागर (डॉक्स) करना संभव है। इस सवाल पर मुझे अभी पक्का जवाब नहीं मिला, लेकिन अब मेरे दिमाग में यह तस्वीर ज्यादा साफ है कि ऐसा टूल कैसा दिखेगा। इसमें एम्बेडिंग सर्च से ज्यादा “grep” जैसे तरीकों की ज़रूरत होगी, और उन वेबसाइटों को खंगालना पड़ेगा जिन्हें कॉमनक्रॉल “robots.txt” के कारण नहीं खंगालता। ऐसे डॉक्सिंग टूल (जैसे व्हाइटपेजेज) शायद डेटा दलालों से जानकारी खरीदते हैं, जो “robots.txt” का पालन नहीं करते, इसलिए उनके पास ज्यादा जानकारी होती है। मैंने यह भी सीखा कि शैली-पहचान तभी कारगर होती है जब आप क्लासिकल तरीकों से संभावित मिलान की संख्या कम कर लें। स्टाइलोमेट्रिक एक हज़ार में से एक व्यक्ति का पता लगाने में मदद कर सकता है, लेकिन दस लाख में से एक को ढूँढना उतना आसान नहीं है। इसलिए इसे पारंपरिक तरीकों के साथ मिलाना होगा।