1. ভূমিকা ও সংক্ষিপ্ত বিবরণ
একক চিত্র থেকে আলোক অনুমান কম্পিউটার ভিশন ও গ্রাফিক্সে একটি গুরুত্বপূর্ণ কিন্তু অসংজ্ঞায়িত সমস্যা, যা অগমেন্টেড/ভার্চুয়াল রিয়েলিটিতে উচ্চ-গতিশীল-পরিসর (এইচডিআর) পুনরালোকনের মতো প্রয়োগের জন্য অপরিহার্য। মূল চ্যালেঞ্জটি হলো একটি সীমিত দৃশ্যক্ষেত্র, নিম্ন-গতিশীল-পরিসর (এলডিআর) ইনপুট থেকে একটি পূর্ণ গোলাকার, এইচডিআর আলোক পরিবেশ অনুমান করা। ঐতিহ্যগত পদ্ধতিগুলি আলোককে হয় ফ্রিকোয়েন্সি ডোমেইনে (যেমন, গোলাকার হারমোনিক্স) বা স্পেসিয়াল ডোমেইনে (যেমন, এনভায়রনমেন্ট ম্যাপ, গোলাকার গাউসিয়ান) মডেল করে, যার প্রতিটির উল্লেখযোগ্য সীমাবদ্ধতা রয়েছে। ফ্রিকোয়েন্সি-ডোমেইন পদ্ধতিগুলিতে স্থানিক স্থানীয়করণের অভাব থাকে, আলোর উৎসগুলিকে ঝাপসা করে এবং ছায়াগুলিকে দুর্বল করে। স্পেসিয়াল-ডোমেইন পদ্ধতিগুলি প্রায়শই সাধারণীকরণ বা প্রশিক্ষণের জটিলতার সাথে লড়াই করে এবং স্পষ্টভাবে ফ্রিকোয়েন্সি তথ্য পরিচালনা নাও করতে পারে, যার ফলে ভুল পুনরালোকন ঘটে।
এই গবেষণাপত্রটি নিডললাইট পরিচয় করিয়ে দেয়, একটি অভিনব কাঠামো যা নিডলেট—এক ধরনের গোলাকার ওয়েভলেট—কে আলোক উপস্থাপনের জন্য যৌথ ফ্রিকোয়েন্সি-স্থানিক ভিত্তি হিসাবে নিয়োগ করে এই ব্যবধানটি পূরণ করে। মূল উদ্ভাবনের মধ্যে রয়েছে নিডলেট সহগের জন্য একটি স্পার্সিফিকেশন কৌশল এবং একটি অভিনব গোলাকার পরিবহন ক্ষতি (এসটিএল) যা সর্বোত্তম পরিবহন তত্ত্বের উপর ভিত্তি করে স্থানিক সচেতনতা সহ প্যারামিটার রিগ্রেশনকে নির্দেশনা দেয়।
2. পদ্ধতি ও প্রযুক্তিগত কাঠামো
নিডললাইট পাইপলাইন একটি ইনপুট চিত্র থেকে নিডলেট সহগ অনুমান করে, যা তারপর আলোক ম্যাপ পুনর্গঠনের জন্য ব্যবহৃত হয়।
2.1 আলোকীকরণের জন্য নিডলেট ভিত্তি
নিডলেটগুলি হল দ্বিতীয় প্রজন্মের গোলাকার ওয়েভলেট যা গোলকের উপর একটি টাইট ফ্রেম প্রদান করে, ফ্রিকোয়েন্সি (এসএইচ-এর মতো) এবং স্থান উভয় ক্ষেত্রেই (এসএইচ-এর বিপরীতে) চমৎকার স্থানীয়করণ বৈশিষ্ট্য প্রদান করে। একক গোলক $S^2$-এর উপর একটি আলোক ফাংশন $L(\omega)$ নিম্নরূপে বিভাজিত করা যেতে পারে:
$$L(\omega) = \sum_{j=0}^{\infty} \sum_{k=1}^{N_j} \beta_{j,k} \psi_{j,k}(\omega)$$
যেখানে $\psi_{j,k}$ হল রেজোলিউশন লেভেল $j$ এবং অবস্থান সূচক $k$-এ নিডলেট ফাংশন, এবং $\beta_{j,k}$ হল সংশ্লিষ্ট সহগ। এটি জটিল আলোকের একটি কমপ্যাক্ট, মাল্টি-রেজোলিউশন উপস্থাপনা সম্ভব করে।
2.2 সর্বোত্তম থ্রেশহোল্ডিংয়ের মাধ্যমে স্পার্স নিডলেট
কাঁচা নিডলেট সহগগুলি অতিরিক্ত হতে পারে। গবেষণাপত্রটি প্রশিক্ষণের সময় প্রয়োগ করা একটি সর্বোত্তম থ্রেশহোল্ডিং ফাংশন $T_{\lambda}(\cdot)$ চালু করেছে যা স্পার্সিটিকে উৎসাহিত করে:
$$\hat{\beta}_{j,k} = T_{\lambda}(\beta_{j,k})$$
এই ফাংশনটি একটি অভিযোজিত থ্রেশহোল্ড $\lambda$-এর নিচের সহগগুলিকে শূন্য করে দেয়, যা শক্তি বন্টনের উপর ভিত্তি করে শেখা বা উদ্ভূত হয়। স্পার্সিটি মডেলটিকে সবচেয়ে উল্লেখযোগ্য আলোক উপাদানগুলির (যেমন, প্রাথমিক আলোর উৎস) উপর ফোকাস করে, অনুমানের নির্ভুলতা এবং রোবাস্টনেস উন্নত করে।
2.3 গোলাকার পরিবহন ক্ষতি (এসটিএল)
স্থানিকভাবে স্থানীয়কৃত নিডলেট সহগগুলিকে কার্যকরভাবে রিগ্রেস করতে, একটি সাধারণ এল২ ক্ষতি অপর্যাপ্ত। লেখকরা সর্বোত্তম পরিবহন (ওটি) তত্ত্বের উপর ভিত্তি করে গোলাকার পরিবহন ক্ষতি (এসটিএল) প্রস্তাব করেছেন। $S^2$-এর উপর বন্টন হিসাবে বিবেচিত পূর্বাভাসিত এবং গ্রাউন্ড-ট্রুথ আলোক ম্যাপ $\hat{L}$ এবং $L$-এর জন্য, এসটিএল একটি পরিবর্তিত ওয়াসারস্টেইন দূরত্ব গণনা করে:
$$\mathcal{L}_{STL}(\hat{L}, L) = \inf_{\pi \in \Pi(\hat{L}, L)} \int_{S^2 \times S^2} c(\omega, \omega') d\pi(\omega, \omega') + \lambda_{reg} R(\pi)$$
যেখানে $c(\omega, \omega')$ হল গোলকের উপর একটি জিওডেসিক খরচ, $\Pi$ হল পরিবহন পরিকল্পনার সেট, এবং $R$ হল একটি নিয়মিতকারী। এসটিএল স্বভাবতই আলোকের স্থানিক কাঠামো বিবেচনা করে, যার ফলে তীক্ষ্ণ ছায়া এবং আলোর উৎসের সীমানা সংরক্ষণে উন্নতি ঘটে।
3. পরীক্ষামূলক ফলাফল ও মূল্যায়ন
নিডললাইটের মূল্যায়ন করা হয়েছে লাভাল ইন্ডোর এইচডিআর এবং সিনথেটিক বেঞ্চমার্কের মতো স্ট্যান্ডার্ড ডেটাসেটে।
3.1 পরিমাণগত মেট্রিক্স
গবেষণাপত্রটি রেন্ডার-ভিত্তিক মূল্যায়নের সমস্যাগুলি এড়াতে একটি সরাসরি আলোক ম্যাপ মেট্রিক (যেমন, গোলকের উপর কৌণিক ত্রুটি) প্রস্তাব করে। নিডললাইট একাধিক মেট্রিক জুড়ে সর্বশেষ পদ্ধতিগুলিকে (যেমন, গ্যারন এট আল. [১৫], গার্ডনার এট আল. [১৩]) ধারাবাহিকভাবে ছাড়িয়ে যায়, ত্রুটিতে উল্লেখযোগ্য হ্রাস দেখায় (কৌণিক ত্রুটিতে ~১৫-২০% উন্নতি হিসাবে রিপোর্ট করা হয়েছে)।
মূল কর্মক্ষমতা হাইলাইটস
- উচ্চতর নির্ভুলতা: এসএইচ-ভিত্তি এবং এসজি-ভিত্তি পদ্ধতির তুলনায় কম কৌণিক ত্রুটি।
- উন্নত সাধারণীকরণ: বিভিন্ন ইনডোর এবং আউটডোর দৃশ্যগুলিতে রোবাস্ট কর্মক্ষমতা।
- দক্ষ উপস্থাপনা: ঘন উপস্থাপনার তুলনায় স্পার্স নিডলেটগুলির জন্য কম সক্রিয় প্যারামিটার প্রয়োজন।
3.2 গুণগত বিশ্লেষণ ও চাক্ষুষ তুলনা
গবেষণাপত্রের চিত্র ১ একটি আকর্ষণীয় চাক্ষুষ তুলনা প্রদান করে। গ্যারন এট আল. [১৫] (এসএইচ-ভিত্তি) এর মতো পদ্ধতিগুলি দুর্বল ছায়া সহ অত্যধিক মসৃণ আলোক তৈরি করে। গার্ডনার এট আল. [১৩] (এসজি-ভিত্তি) কিছু তীক্ষ্ণতা পুনরুদ্ধার করতে পারে কিন্তু আর্টিফ্যাক্ট প্রবর্তন করতে পারে বা উচ্চ-ফ্রিকোয়েন্সি বিবরণ হারাতে পারে। বিপরীতে, নিডললাইটের ফলাফলগুলি গ্রাউন্ড ট্রুথের সাথে ঘনিষ্ঠভাবে মেলে, আলোর উৎসের দিক, তীব্রতা এবং স্থানিক পরিসীমা সঠিকভাবে ক্যাপচার করে, যার ফলে সন্নিবেশিত ভার্চুয়াল বস্তুগুলিতে বাস্তবসম্মত কঠিন ছায়া এবং স্পেকুলার হাইলাইট তৈরি হয়।
চার্ট/চিত্র বর্ণনা: পুনরালোকন ফলাফল দেখানো একটি ২x২ গ্রিড। সাবফিগার (ক) একটি ফ্রিকোয়েন্সি-ডোমেইন পদ্ধতি থেকে একটি ঝাপসা, ছায়াবিহীন ফলাফল দেখায়। সাবফিগার (খ) একটি স্পেসিয়াল-ডোমেইন পদ্ধতি থেকে কিছু স্থানীয়করণ কিন্তু সম্ভাব্য আর্টিফ্যাক্ট সহ একটি ফলাফল দেখায়। সাবফিগার (গ) (আমাদের) সুস্পষ্ট, সঠিক পুনরালোকন দেখায় যাতে সুসংজ্ঞায়িত ছায়া রয়েছে। সাবফিগার (ঘ) তুলনার জন্য গ্রাউন্ড ট্রুথ দেখায়।
4. মূল বিশ্লেষণ ও বিশেষজ্ঞ ব্যাখ্যা
মূল অন্তর্দৃষ্টি: নিডললাইট শুধু একটি ক্রমবর্ধমান উন্নতি নয়; এটি একটি প্যারাডাইম শিফট যা আলোক অনুমানের জন্য ফ্রিকোয়েন্সি এবং স্থানিক ডোমেইনকে সফলভাবে একত্রিত করে। আসল অগ্রগতি হল এই স্বীকৃতি যে আলোক স্বভাবতই একটি গোলকের উপর মাল্টি-রেজোলিউশন, স্থানিকভাবে স্থানীয়কৃত সংকেত—একটি সমস্যা যা শুধু ফুরিয়ার (এসএইচ) বা পয়েন্ট (এসজি) উপস্থাপনার জন্য নয়, বরং ওয়েভলেট বিশ্লেষণের জন্য চিৎকার করছে। এটি বিশুদ্ধ ফ্রিকোয়েন্সি ভিত্তি ছাড়িয়ে যাওয়া সিগন্যাল প্রসেসিং-এর বৃহত্তর প্রবণতার সাথে সামঞ্জস্যপূর্ণ।
যুক্তিগত প্রবাহ: যুক্তি অখণ্ডনীয়। ১) বিদ্যমান দ্বৈত-ডোমেইন পদ্ধতির ত্রুটিগুলি চিহ্নিত করা। ২) একটি গাণিতিক টুল (নিডলেট) নির্বাচন করা যা স্বাভাবিকভাবে কাঙ্ক্ষিত যৌথ স্থানীয়করণ বৈশিষ্ট্য ধারণ করে। ৩) সেই টুলের অতিরিক্ততা সমস্যা সমাধান করা (স্পার্সিফিকেশন)। ৪) একটি ক্ষতি ফাংশন (এসটিএল) ডিজাইন করা যা টুলের জ্যামিতি এবং সমস্যার স্থানিক সীমাবদ্ধতাকে সম্মান করে। এটি একটি সু-প্রেরণাপ্রাপ্ত গবেষণা পাইপলাইনের আদর্শ উদাহরণ।
শক্তি ও ত্রুটি: এর শক্তি হল এর মার্জিত তাত্ত্বিক ভিত্তি এবং প্রদর্শিত উচ্চতর কর্মক্ষমতা। ক্ষতি ডিজাইনের জন্য সর্বোত্তম পরিবহনের ব্যবহার বিশেষভাবে চতুর, ডব্লিউজিএএন-এর মতো জেনারেটিভ মডেলগুলিতে এর সাফল্যের কথা স্মরণ করিয়ে দেয়, অর্থপূর্ণ জ্যামিতিক তুলনা নিশ্চিত করে। যাইহোক, গবেষণাপত্রের সম্ভাব্য ত্রুটি হল ব্যবহারিক জটিলতা। এল২ ক্ষতির তুলনায়, গোলকের উপর ওটি সমস্যা সমাধানের গণনীয় খরচ, এমনকি সিঙ্কহর্ন পুনরাবৃত্তির মতো আনুমানিক পদ্ধতি দিয়েও, তুচ্ছ নয়। পিডিএফ-এ গভীরভাবে অন্বেষণ না করা হলেও, এটি রিয়েল-টাইম প্রয়োগগুলিকে বাধা দিতে পারে—এআর/ভিআর পুনরালোকনের জন্য একটি মূল ব্যবহারের ক্ষেত্র। তদুপরি, স্পার্সিটি থ্রেশহোল্ড $\lambda$-এর সতর্ক টিউনিং প্রয়োজন; একটি অনুপযুক্ত মান পরিবেষ্টিত ফিল লাইটের মতো গুরুত্বপূর্ণ দুর্বল আলোক উপাদানগুলিকে ছাঁটাই করতে পারে।
কার্যকরী অন্তর্দৃষ্টি: অনুশীলনকারীদের জন্য, এই কাজটি একটি নতুন বেঞ্চমার্ক স্থাপন করে। যখন গতির উপর নির্ভুলতা সর্বোচ্চ অগ্রাধিকার পায়, তখন নিডললাইটের কাঠামোই শুরু হওয়া উচিত। গবেষকদের জন্য, দরজা এখন খোলা। ভবিষ্যতের কাজকে অবশ্যই এসটিএল-এর গণনীয় পদচিহ্ন অপ্টিমাইজ করার উপর ফোকাস করতে হবে—সম্ভবত শেখা খরচ ম্যাট্রিক্স বা স্নায়বিক ওটি সলভারের মাধ্যমে যেমন এমআইটি এবং গুগল রিসার্চের সাম্প্রতিক কাজগুলিতে দেখা যায়। আরেকটি উপায় হল বিভিন্ন গোলাকার ওয়েভলেট পরিবার বা অভিযোজিত থ্রেশহোল্ডিং স্কিম অন্বেষণ করা। "যৌথ-ডোমেইন উপস্থাপনা + জ্যামিতিকভাবে সচেতন ক্ষতি" এর মূল ধারণাটি ভিশনের অন্যান্য গোলাকার রিগ্রেশন সমস্যায়, যেমন ৩৬০° গভীরতা অনুমান বা আকাশ মডেলিং-এ, উচ্চ রপ্তানিযোগ্য।
5. প্রযুক্তিগত বিবরণ ও গাণিতিক সূত্রায়ন
নিডলেট নির্মাণ: নিডলেট $\psi_{j,k}(\omega)$ একটি সাবধানে নির্বাচিত উইন্ডো ফাংশন $b(\cdot)$ দিয়ে গোলাকার হারমোনিক্সের কনভোলিউশনের মাধ্যমে সংজ্ঞায়িত করা হয় যা মসৃণভাবে ক্ষয় হয়:
$$\psi_{j,k}(\omega) = \sqrt{\lambda_{j,k}} \sum_{l=0}^{\infty} b\left(\frac{l}{B^j}\right) \sum_{m=-l}^{l} Y_{l,m}(\xi_{j,k}) \overline{Y_{l,m}(\omega)}$$
যেখানে $B > 1$ একটি ডাইলেশন প্যারামিটার, $\{\xi_{j,k}\}$ হল কোয়াড্রেচার পয়েন্ট, এবং $\lambda_{j,k}$ হল কিউবেচার ওজন। এটি স্থানীয়করণ এবং টাইট ফ্রেম বৈশিষ্ট্য নিশ্চিত করে।
সর্বোত্তম পরিবহন সূত্রায়ন: এসটিএল ওয়াসারস্টেইন-১ দূরত্বের সুবিধা নেয়। $N$ পয়েন্ট সহ একটি বিচ্ছিন্ন গোলকের উপর, এটি একটি পরিবহন পরিকল্পনা $\mathbf{P} \in \mathbb{R}^{N \times N}_+$ খোঁজে যা ন্যূনতম করে:
$$\langle \mathbf{C}, \mathbf{P} \rangle_F \quad \text{s.t.} \quad \mathbf{P} \mathbf{1} = \mathbf{a}, \mathbf{P}^T \mathbf{1} = \mathbf{b}$$
যেখানে $\mathbf{C}_{ij}=c(\omega_i, \omega_j)$ হল জিওডেসিক খরচ ম্যাট্রিক্স, এবং $\mathbf{a}, \mathbf{b}$ হল $\hat{L}$ এবং $L$-এর বিচ্ছিন্ন বন্টন। দক্ষ গণনার জন্য সাধারণত একটি এনট্রপি-নিয়মিত সিঙ্কহর্ন অ্যালগরিদম ব্যবহার করা হয়।
6. বিশ্লেষণ কাঠামো ও ধারণাগত উদাহরণ
দৃশ্যকল্প: একটি রোদেলা জানালা এবং একটি টেবিল ল্যাম্প সহ একটি ঘরের ছবি থেকে আলোক অনুমান করা।
ঐতিহ্যগত এসএইচ পদ্ধতি: নিম্ন-ক্রম সহগগুলির একটি সেট তৈরি করবে (যেমন, ব্যান্ড ২ বা ৩ পর্যন্ত)। এটি আলোর একটি মসৃণ, বিচ্ছুরিত "গ্লোব" তৈরি করে, জানালা থেকে তীক্ষ্ণ, দিকনির্দেশক রশ্মি (উচ্চ-ফ্রিকোয়েন্সি, স্থানিকভাবে স্থানীয়কৃত) এবং ল্যাম্পের নরম, স্থানীয়কৃত আভা (মধ্য-ফ্রিকোয়েন্সি, স্থানিকভাবে স্থানীয়কৃত) আলাদা করতে ব্যর্থ হয়। ফলাফলটি একটি গড়, ছায়াবিহীন আলোক।
নিডললাইট কাঠামো:
- নিডলেট বিভাজন: প্রকৃত আলোক নিডলেটগুলিতে প্রক্ষিপ্ত হয়। তীক্ষ্ণ সূর্যালোক ক্যাপচার করার জন্য জানালার দিকের কাছাকাছি উচ্চ-রেজোলিউশন নিডলেটগুলি শক্তিশালীভাবে সক্রিয় হয়। ল্যাম্পের অবস্থানের কাছাকাছি মধ্য-রেজোলিউশন নিডলেটগুলি এর আভা ক্যাপচার করার জন্য সক্রিয় হয়। নিম্ন-রেজোলিউশন নিডলেটগুলি সামগ্রিক পরিবেষ্টিত ঘরের আলো ক্যাপচার করে।
- স্পার্সিফিকেশন: সর্বোত্তম থ্রেশহোল্ডিং ফাংশন এই শক্তিশালী, অর্থপূর্ণ সহগগুলিকে চিহ্নিত করে এবং ধরে রাখে যখন গোলকের অন্ধকার এলাকা থেকে নগণ্য সহগগুলিকে শূন্য করে।
- রিগ্রেশন ও এসটিএল: নেটওয়ার্কটি এই স্পার্স সহগ সেটটি ভবিষ্যদ্বাণী করতে শেখে। এসটিএল নিশ্চিত করে যে যদি পূর্বাভাসিত জানালার হাইলাইটটি তার প্রকৃত অবস্থান থেকে ১০ ডিগ্রি দূরে থাকে, তবে এটি গোলকীয় দূরত্বের সমানুপাতিক একটি উল্লেখযোগ্য শাস্তি বহন করে, নেটওয়ার্কটিকে সঠিক স্থানিক স্থানীয়করণের দিকে নির্দেশনা দেয়।
- পুনর্গঠন: স্পার্স নিডলেট সহগগুলিকে যোগ করা হয়, একটি উজ্জ্বল, তীক্ষ্ণ জানালার হাইলাইট, একটি স্বতন্ত্র ল্যাম্প আভা এবং সঠিক পরিবেষ্টিত শেডিং সহ একটি আলোক ম্যাপ পুনর্গঠন করে—বাস্তবসম্মত ভার্চুয়াল বস্তু সন্নিবেশ সম্ভব করে।
7. ভবিষ্যৎ প্রয়োগ ও গবেষণার দিকনির্দেশ
- রিয়েল-টাইম এআর/ভিআর: প্রাথমিক প্রয়োগ হল মিশ্র বাস্তবতার জন্য ফটোরিয়ালিস্টিক রিয়েল-টাইম পুনরালোকন। ভবিষ্যতের কাজকে অবশ্যই মোবাইল এবং এজ ডিভাইসের জন্য নিডললাইট অপ্টিমাইজ করতে হবে, সম্ভবত হালকা নেটওয়ার্কে জ্ঞান পাতনের মাধ্যমে।
- স্নায়বিক রেন্ডারিং ও ইনভার্স গ্রাফিক্স: নিডললাইটের আলোক উপস্থাপনা এন্ড-টু-এন্ড স্নায়বিক রেন্ডারিং পাইপলাইন যেমন এনইআরএফ-এ একীভূত করা যেতে পারে, জ্যামিতি এবং প্রতিফলন থেকে আলোককে আলাদা করে এবং সঠিকভাবে অনুমান করতে সাহায্য করে।
- আলোকীকরণের জন্য জেনারেটিভ মডেল: স্পার্স নিডলেট লেটেন্ট স্পেস জেনারেটিভ অ্যাডভারসারিয়াল নেটওয়ার্ক (জিএএন) বা ডিফিউশন মডেলগুলিতে প্রশিক্ষণ বা কন্টেন্ট তৈরির জন্য বিশ্বাসযোগ্য, বৈচিত্র্যময় ইনডোর/আউটডোর আলোক পরিবেশ সংশ্লেষণ করতে ব্যবহার করা যেতে পারে।
- ভিডিওতে প্রসারিত: ভিডিও ফ্রেম জুড়ে সামঞ্জস্যপূর্ণ আলোক অনুমানের জন্য সময়গতভাবে কাঠামো প্রয়োগ করা, চলন্ত আলোর উৎস এবং গতিশীল ছায়া পরিচালনা করা।
- আরজিবির বাইরে: অসংজ্ঞায়িত সমস্যাকে আরও সীমাবদ্ধ করার জন্য অতিরিক্ত ইনপুট হিসাবে অন্যান্য সেন্সর ডেটা (যেমন, লিডার বা টিওএফ ক্যামেরা থেকে গভীরতা) অন্তর্ভুক্ত করা।
8. তথ্যসূত্র
- ঝান, এফ., ঝাং, সি., হু, ডব্লিউ., লু, এস., মা, এফ., জাই, এক্স., এবং শাও, এল. (২০২১)। স্পার্স নিডলেটস ফর লাইটিং এস্টিমেশন উইথ স্ফেরিক্যাল ট্রান্সপোর্ট লস। arXiv প্রিপ্রিন্ট arXiv:2106.13090।
- গ্যারন, এম., সুনকাভালি, কে., হাদাপ, এস., কার, এন., এবং লালন্ডে, জে. এফ. (২০১৯)। ফাস্ট স্পেশিয়ালি-ভ্যারিয়িং ইন্ডোর লাইটিং এস্টিমেশন। প্রসিডিংস অফ দ্য আইইইই/সিভিএফ কনফারেন্স অন কম্পিউটার ভিশন অ্যান্ড প্যাটার্ন রিকগনিশন (পিপি. ৬৯০৮-৬৯১৭)।
- গার্ডনার, এম. এ., হোল্ড-জিওফ্রয়, ওয়াই., সুনকাভালি, কে., গাগনে, সি., এবং লালন্ডে, জে. এফ. (২০১৯)। ডিপ প্যারামেট্রিক ইন্ডোর লাইটিং এস্টিমেশন। প্রসিডিংস অফ দ্য আইইইই/সিভিএফ ইন্টারন্যাশনাল কনফারেন্স অন কম্পিউটার ভিশন (পিপি. ৭১৭৫-৭১৮৩)।
- নারকোভিচ, এফ. জে., পেট্রুশেভ, পি., এবং ওয়ার্ড, জে. ডি. (২০০৬)। লোকালাইজড টাইট ফ্রেমস অন স্ফিয়ার্স। এসআইএএম জার্নাল অন ম্যাথমেটিক্যাল অ্যানালাইসিস, ৩৮(২), ৫৭৪-৫৯৪। (মৌলিক নিডলেট গবেষণাপত্র)
- আর্জোভস্কি, এম., চিন্তালা, এস., এবং বট্টু, এল. (২০১৭)। ওয়াসারস্টেইন জেনারেটিভ অ্যাডভারসারিয়াল নেটওয়ার্কস। ইন্টারন্যাশনাল কনফারেন্স অন মেশিন লার্নিং (পিপি. ২১৪-২২৩)। পিএমএলআর। (এমএল-এর জন্য মৌলিক ওটি)
- মিল্ডেনহল, বি., শ্রীনিবাসন, পি. পি., ট্যানসিক, এম., ব্যারন, জে. টি., রামামুর্থি, আর., এবং এনজি, আর. (২০২০)। এনইআরএফ: রিপ্রেজেন্টিং সিনস অ্যাজ নিউরাল রেডিয়েন্স ফিল্ডস ফর ভিউ সিনথেসিস। ইউরোপিয়ান কনফারেন্স অন কম্পিউটার ভিশন (পিপি. ৪০৫-৪২১)। স্প্রিঙ্গার। (ইনভার্স রেন্ডারিং-এর জন্য প্রাসঙ্গিক)।