ViewVC Help
View File | Revision Log | Show Annotations | Download File | Root Listing
root/radiance/ray/src/rt/ambcomp.c
(Generate patch)

Comparing ray/src/rt/ambcomp.c (file contents):
Revision 2.47 by greg, Sat May 3 05:46:19 2014 UTC vs.
Revision 2.60 by greg, Sat May 17 00:49:17 2014 UTC

# Line 23 | Line 23 | static const char      RCSid[] = "$Id$";
23  
24   #ifdef NEWAMB
25  
26 /* #define HEM_MULT     4.0     /* hem multiplier (bigger => sparser cache) */
27
26   extern void             SDsquare2disk(double ds[2], double seedx, double seedy);
27  
30                                /* vertex direction bit positions */
31 #define VDB_xy  0
32 #define VDB_y   01
33 #define VDB_x   02
34 #define VDB_Xy  03
35 #define VDB_xY  04
36 #define VDB_X   05
37 #define VDB_Y   06
38 #define VDB_XY  07
39                                /* get opposite vertex direction bit */
40 #define VDB_OPP(f)      (~(f) & 07)
41                                /* adjacent triangle vertex flags */
42 static const int  adjacent_trifl[8] = {
43                        0,                      /* forbidden diagonal */
44                        1<<VDB_x|1<<VDB_y|1<<VDB_Xy,
45                        1<<VDB_y|1<<VDB_x|1<<VDB_xY,
46                        1<<VDB_y|1<<VDB_Xy|1<<VDB_X,
47                        1<<VDB_x|1<<VDB_xY|1<<VDB_Y,
48                        1<<VDB_Xy|1<<VDB_X|1<<VDB_Y,
49                        1<<VDB_xY|1<<VDB_Y|1<<VDB_X,
50                        0,                      /* forbidden diagonal */
51                };
52
28   typedef struct {
29          COLOR   v;              /* hemisphere sample value */
30          float   d;              /* reciprocal distance (1/rt) */
# Line 64 | Line 39 | typedef struct {
39          AMBSAMP sa[1];          /* sample array (extends struct) */
40   }  AMBHEMI;             /* ambient sample hemisphere */
41  
42 < #define ambndx(h,i,j)   ((i)*(h)->ns + (j))
43 < #define ambsam(h,i,j)   (h)->sa[ambndx(h,i,j)]
42 > #define AI(h,i,j)       ((i)*(h)->ns + (j))
43 > #define ambsam(h,i,j)   (h)->sa[AI(h,i,j)]
44  
45   typedef struct {
46          FVECT   r_i, r_i1, e_i, rcp, rI2_eJ2;
47          double  I1, I2;
73        int     valid;
48   } FFTRI;                /* vectors and coefficients for Hessian calculation */
49  
50  
77 /* Get index for adjacent vertex */
78 static int
79 adjacent_verti(AMBHEMI *hp, int i, int j, int dbit)
80 {
81        int     i0 = i*hp->ns + j;
82
83        switch (dbit) {
84        case VDB_y:     return(i0 - hp->ns);
85        case VDB_x:     return(i0 - 1);
86        case VDB_Xy:    return(i0 - hp->ns + 1);
87        case VDB_xY:    return(i0 + hp->ns - 1);
88        case VDB_X:     return(i0 + 1);
89        case VDB_Y:     return(i0 + hp->ns);
90                                /* the following should never occur */
91        case VDB_xy:    return(i0 - hp->ns - 1);
92        case VDB_XY:    return(i0 + hp->ns + 1);
93        }
94        return(-1);
95 }
96
97
98 /* Get vertex direction bit for the opposite edge to complete triangle */
99 static int
100 vdb_edge(int db1, int db2)
101 {
102        switch (db1) {
103        case VDB_x:     return(db2==VDB_y ? VDB_Xy : VDB_Y);
104        case VDB_y:     return(db2==VDB_x ? VDB_xY : VDB_X);
105        case VDB_X:     return(db2==VDB_Xy ? VDB_y : VDB_xY);
106        case VDB_Y:     return(db2==VDB_xY ? VDB_x : VDB_Xy);
107        case VDB_xY:    return(db2==VDB_x ? VDB_y : VDB_X);
108        case VDB_Xy:    return(db2==VDB_y ? VDB_x : VDB_Y);
109        }
110        error(INTERNAL, "forbidden diagonal in vdb_edge()");
111        return(-1);
112 }
113
114
51   static AMBHEMI *
52   inithemi(                       /* initialize sampling hemisphere */
53          COLOR   ac,
# Line 192 | Line 128 | getambsamp(RAY *arp, AMBHEMI *hp, int i, int j, int n)
128                                  spt[1]*hp->uy[ii] +
129                                  zd*hp->rp->ron[ii];
130          checknorm(arp->rdir);
131 <        dimlist[ndims++] = ambndx(hp,i,j) + 90171;
131 >        dimlist[ndims++] = AI(hp,i,j) + 90171;
132          rayvalue(arp);                  /* evaluate ray */
133          ndims--;                        /* apply coefficient */
134          multcolor(arp->rcol, arp->rcoef);
# Line 245 | Line 181 | getambdiffs(AMBHEMI *hp)
181                          ep[0] += d2;
182                          ep[-hp->ns] += d2;
183                  }
184 <                if (j) {                /* from behind */
185 <                        d2 = b - bright(ap[-1].v);
186 <                        d2 *= d2;
187 <                        ep[0] += d2;
188 <                        ep[-1] += d2;
189 <                }
184 >                if (!j) continue;
185 >                                        /* from behind */
186 >                d2 = b - bright(ap[-1].v);
187 >                d2 *= d2;
188 >                ep[0] += d2;
189 >                ep[-1] += d2;
190 >                if (!i) continue;
191 >                                        /* diagonal */
192 >                d2 = b - bright(ap[-hp->ns-1].v);
193 >                d2 *= d2;
194 >                ep[0] += d2;
195 >                ep[-hp->ns-1] += d2;
196              }
197                                          /* correct for number of neighbors */
198 <        earr[0] *= 2.f;
199 <        earr[hp->ns-1] *= 2.f;
200 <        earr[(hp->ns-1)*hp->ns] *= 2.f;
201 <        earr[(hp->ns-1)*hp->ns + hp->ns-1] *= 2.f;
198 >        earr[0] *= 8./3.;
199 >        earr[hp->ns-1] *= 8./3.;
200 >        earr[(hp->ns-1)*hp->ns] *= 8./3.;
201 >        earr[(hp->ns-1)*hp->ns + hp->ns-1] *= 8./3.;
202          for (i = 1; i < hp->ns-1; i++) {
203 <                earr[i*hp->ns] *= 4./3.;
204 <                earr[i*hp->ns + hp->ns-1] *= 4./3.;
203 >                earr[i*hp->ns] *= 8./5.;
204 >                earr[i*hp->ns + hp->ns-1] *= 8./5.;
205          }
206          for (j = 1; j < hp->ns-1; j++) {
207 <                earr[j] *= 4./3.;
208 <                earr[(hp->ns-1)*hp->ns + j] *= 4./3.;
207 >                earr[j] *= 8./5.;
208 >                earr[(hp->ns-1)*hp->ns + j] *= 8./5.;
209          }
210          return(earr);
211   }
# Line 274 | Line 216 | static void
216   ambsupersamp(double acol[3], AMBHEMI *hp, int cnt)
217   {
218          float   *earr = getambdiffs(hp);
219 <        double  e2sum = 0;
219 >        double  e2rem = 0;
220          AMBSAMP *ap;
221          RAY     ar;
222 <        COLOR   asum;
222 >        double  asum[3];
223          float   *ep;
224 <        int     i, j, n;
224 >        int     i, j, n, nss;
225  
226          if (earr == NULL)               /* just skip calc. if no memory */
227                  return;
228 <                                        /* add up estimated variances */
229 <        for (ep = earr + hp->ns*hp->ns; ep-- > earr; )
230 <                e2sum += *ep;
228 >                                        /* accumulate estimated variances */
229 >        for (ep = earr + hp->ns*hp->ns; ep > earr; )
230 >                e2rem += *--ep;
231          ep = earr;                      /* perform super-sampling */
232          for (ap = hp->sa, i = 0; i < hp->ns; i++)
233              for (j = 0; j < hp->ns; j++, ap++) {
234 <                int     nss = *ep/e2sum*cnt + frandom();
235 <                setcolor(asum, 0., 0., 0.);
234 >                if (e2rem <= FTINY)
235 >                        goto done;      /* nothing left to do */
236 >                nss = *ep/e2rem*cnt + frandom();
237 >                asum[0] = asum[1] = asum[2] = 0.0;
238                  for (n = 1; n <= nss; n++) {
239                          if (!getambsamp(&ar, hp, i, j, n)) {
240                                  nss = n-1;
# Line 299 | Line 243 | ambsupersamp(double acol[3], AMBHEMI *hp, int cnt)
243                          addcolor(asum, ar.rcol);
244                  }
245                  if (nss) {              /* update returned ambient value */
246 <                        const double    ssf = 1./(nss + 1);
246 >                        const double    ssf = 1./(nss + 1.);
247                          for (n = 3; n--; )
248 <                                acol[n] += ssf*colval(asum,n) +
248 >                                acol[n] += ssf*asum[n] +
249                                                  (ssf - 1.)*colval(ap->v,n);
250                  }
251 <                e2sum -= *ep++;         /* update remainders */
251 >                e2rem -= *ep++;         /* update remainders */
252                  cnt -= nss;
253          }
254 + done:
255          free(earr);
256   }
257  
258  
314 /* Compute vertex flags, indicating farthest in each direction */
315 static uby8 *
316 vertex_flags(AMBHEMI *hp)
317 {
318        uby8    *vflags = (uby8 *)calloc(hp->ns*hp->ns, sizeof(uby8));
319        uby8    *vf;
320        AMBSAMP *ap;
321        int     i, j;
322
323        if (vflags == NULL)
324                error(SYSTEM, "out of memory in vertex_flags()");
325        vf = vflags;
326        ap = hp->sa;            /* compute farthest along first row */
327        for (j = 0; j < hp->ns-1; j++, vf++, ap++)
328                if (ap[0].d <= ap[1].d)
329                        vf[0] |= 1<<VDB_X;
330                else
331                        vf[1] |= 1<<VDB_x;
332        ++vf; ++ap;
333                                /* flag subsequent rows */
334        for (i = 1; i < hp->ns; i++) {
335            for (j = 0; j < hp->ns-1; j++, vf++, ap++) {
336                if (ap[0].d <= ap[-hp->ns].d)   /* row before */
337                        vf[0] |= 1<<VDB_y;
338                else
339                        vf[-hp->ns] |= 1<<VDB_Y;
340                if (ap[0].d <= ap[1-hp->ns].d)  /* diagonal we care about */
341                        vf[0] |= 1<<VDB_Xy;
342                else
343                        vf[1-hp->ns] |= 1<<VDB_xY;
344                if (ap[0].d <= ap[1].d)         /* column after */
345                        vf[0] |= 1<<VDB_X;
346                else
347                        vf[1] |= 1<<VDB_x;
348            }
349            if (ap[0].d <= ap[-hp->ns].d)       /* final column edge */
350                vf[0] |= 1<<VDB_y;
351            else
352                vf[-hp->ns] |= 1<<VDB_Y;
353            ++vf; ++ap;
354        }
355        return(vflags);
356 }
357
358
259   /* Return brightness of farthest ambient sample */
260   static double
261 < back_ambval(AMBHEMI *hp, int i, int j, int dbit1, int dbit2, const uby8 *vflags)
261 > back_ambval(AMBHEMI *hp, const int n1, const int n2, const int n3)
262   {
263 <        const int       v0 = ambndx(hp,i,j);
264 <        const int       tflags = (1<<dbit1 | 1<<dbit2);
265 <        int             v1, v2;
266 <
267 <        if ((vflags[v0] & tflags) == tflags)    /* is v0 the farthest? */
268 <                return(colval(hp->sa[v0].v,CIEY));
269 <        v1 = adjacent_verti(hp, i, j, dbit1);
270 <        if (vflags[v0] & 1<<dbit2)              /* v1 farthest if v0>v2 */
371 <                return(colval(hp->sa[v1].v,CIEY));
372 <        v2 = adjacent_verti(hp, i, j, dbit2);
373 <        if (vflags[v0] & 1<<dbit1)              /* v2 farthest if v0>v1 */
374 <                return(colval(hp->sa[v2].v,CIEY));
375 <                                                /* else check if v1>v2 */
376 <        if (vflags[v1] & 1<<vdb_edge(dbit1,dbit2))
377 <                return(colval(hp->sa[v1].v,CIEY));
378 <        return(colval(hp->sa[v2].v,CIEY));
263 >        if (hp->sa[n1].d <= hp->sa[n2].d) {
264 >                if (hp->sa[n1].d <= hp->sa[n3].d)
265 >                        return(colval(hp->sa[n1].v,CIEY));
266 >                return(colval(hp->sa[n3].v,CIEY));
267 >        }
268 >        if (hp->sa[n2].d <= hp->sa[n3].d)
269 >                return(colval(hp->sa[n2].v,CIEY));
270 >        return(colval(hp->sa[n3].v,CIEY));
271   }
272  
273  
274   /* Compute vectors and coefficients for Hessian/gradient calcs */
275   static void
276 < comp_fftri(FFTRI *ftp, AMBHEMI *hp, int i, int j, int dbit, const uby8 *vflags)
276 > comp_fftri(FFTRI *ftp, AMBHEMI *hp, const int n0, const int n1)
277   {
278 <        const int       i0 = ambndx(hp,i,j);
279 <        double          rdot_cp, dot_e, dot_er, rdot_r, rdot_r1, J2;
388 <        int             i1, ii;
278 >        double  rdot_cp, dot_e, dot_er, rdot_r, rdot_r1, J2;
279 >        int     ii;
280  
281 <        ftp->valid = 0;                 /* check if we can skip this edge */
282 <        ii = adjacent_trifl[dbit];
283 <        if ((vflags[i0] & ii) == ii)    /* cancels if vertex used as value */
393 <                return;
394 <        i1 = adjacent_verti(hp, i, j, dbit);
395 <        ii = adjacent_trifl[VDB_OPP(dbit)];
396 <        if ((vflags[i1] & ii) == ii)    /* on either end (for both triangles) */
397 <                return;
398 <                                        /* else go ahead with calculation */
399 <        VSUB(ftp->r_i, hp->sa[i0].p, hp->rp->rop);
400 <        VSUB(ftp->r_i1, hp->sa[i1].p, hp->rp->rop);
401 <        VSUB(ftp->e_i, hp->sa[i1].p, hp->sa[i0].p);
281 >        VSUB(ftp->r_i, hp->sa[n0].p, hp->rp->rop);
282 >        VSUB(ftp->r_i1, hp->sa[n1].p, hp->rp->rop);
283 >        VSUB(ftp->e_i, hp->sa[n1].p, hp->sa[n0].p);
284          VCROSS(ftp->rcp, ftp->r_i, ftp->r_i1);
285          rdot_cp = 1.0/DOT(ftp->rcp,ftp->rcp);
286          dot_e = DOT(ftp->e_i,ftp->e_i);
# Line 412 | Line 294 | comp_fftri(FFTRI *ftp, AMBHEMI *hp, int i, int j, int
294          J2 =  ( 0.5*(rdot_r - rdot_r1) - dot_er*ftp->I2 ) / dot_e;
295          for (ii = 3; ii--; )
296                  ftp->rI2_eJ2[ii] = ftp->I2*ftp->r_i[ii] + J2*ftp->e_i[ii];
415        ftp->valid++;
297   }
298  
299  
# Line 438 | Line 319 | comp_hessian(FVECT hess[3], FFTRI *ftp, FVECT nrm)
319          double  d1, d2, d3, d4;
320          double  I3, J3, K3;
321          int     i, j;
441
442        if (!ftp->valid) {              /* preemptive test */
443                memset(hess, 0, sizeof(FVECT)*3);
444                return;
445        }
322                                          /* compute intermediate coefficients */
323          d1 = 1.0/DOT(ftp->r_i,ftp->r_i);
324          d2 = 1.0/DOT(ftp->r_i1,ftp->r_i1);
# Line 506 | Line 382 | comp_gradient(FVECT grad, FFTRI *ftp, FVECT nrm)
382          double  f1;
383          int     i;
384  
509        if (!ftp->valid) {              /* preemptive test */
510                memset(grad, 0, sizeof(FVECT));
511                return;
512        }
385          f1 = 2.0*DOT(nrm, ftp->rcp);
386          VCROSS(ncp, nrm, ftp->e_i);
387          for (i = 3; i--; )
# Line 539 | Line 411 | add2gradient(FVECT grad, FVECT egrad1, FVECT egrad2, F
411  
412  
413   /* Compute anisotropic radii and eigenvector directions */
414 < static int
414 > static void
415   eigenvectors(FVECT uv[2], float ra[2], FVECT hessian[3])
416   {
417          double  hess2[2][2];
# Line 561 | Line 433 | eigenvectors(FVECT uv[2], float ra[2], FVECT hessian[3
433          if (i == 1)                     /* double-root (circle) */
434                  evalue[1] = evalue[0];
435          if (!i || ((evalue[0] = fabs(evalue[0])) <= FTINY*FTINY) |
436 <                        ((evalue[1] = fabs(evalue[1])) <= FTINY*FTINY) )
437 <                error(INTERNAL, "bad eigenvalue calculation");
438 <
436 >                        ((evalue[1] = fabs(evalue[1])) <= FTINY*FTINY) ) {
437 >                ra[0] = ra[1] = maxarad;
438 >                return;
439 >        }
440          if (evalue[0] > evalue[1]) {
441                  ra[0] = sqrt(sqrt(4.0/evalue[0]));
442                  ra[1] = sqrt(sqrt(4.0/evalue[1]));
# Line 598 | Line 471 | ambHessian(                            /* anisotropic radii & pos. gradient */
471          static char     memerrmsg[] = "out of memory in ambHessian()";
472          FVECT           (*hessrow)[3] = NULL;
473          FVECT           *gradrow = NULL;
601        uby8            *vflags;
474          FVECT           hessian[3];
475          FVECT           gradient;
476          FFTRI           fftr;
# Line 620 | Line 492 | ambHessian(                            /* anisotropic radii & pos. gradient */
492                          error(SYSTEM, memerrmsg);
493                  memset(gradient, 0, sizeof(gradient));
494          }
623                                        /* get vertex position flags */
624        vflags = vertex_flags(hp);
495                                          /* compute first row of edges */
496          for (j = 0; j < hp->ns-1; j++) {
497 <                comp_fftri(&fftr, hp, 0, j, VDB_X, vflags);
497 >                comp_fftri(&fftr, hp, AI(hp,0,j), AI(hp,0,j+1));
498                  if (hessrow != NULL)
499                          comp_hessian(hessrow[j], &fftr, hp->rp->ron);
500                  if (gradrow != NULL)
# Line 634 | Line 504 | ambHessian(                            /* anisotropic radii & pos. gradient */
504          for (i = 0; i < hp->ns-1; i++) {
505              FVECT       hesscol[3];     /* compute first vertical edge */
506              FVECT       gradcol;
507 <            comp_fftri(&fftr, hp, i, 0, VDB_Y, vflags);
507 >            comp_fftri(&fftr, hp, AI(hp,i,0), AI(hp,i+1,0));
508              if (hessrow != NULL)
509                  comp_hessian(hesscol, &fftr, hp->rp->ron);
510              if (gradrow != NULL)
# Line 643 | Line 513 | ambHessian(                            /* anisotropic radii & pos. gradient */
513                  FVECT   hessdia[3];     /* compute triangle contributions */
514                  FVECT   graddia;
515                  double  backg;
516 <                backg = back_ambval(hp, i, j, VDB_X, VDB_Y, vflags);
516 >                backg = back_ambval(hp, AI(hp,i,j),
517 >                                        AI(hp,i,j+1), AI(hp,i+1,j));
518                                          /* diagonal (inner) edge */
519 <                comp_fftri(&fftr, hp, i, j+1, VDB_xY, vflags);
519 >                comp_fftri(&fftr, hp, AI(hp,i,j+1), AI(hp,i+1,j));
520                  if (hessrow != NULL) {
521                      comp_hessian(hessdia, &fftr, hp->rp->ron);
522                      rev_hessian(hesscol);
# Line 657 | Line 528 | ambHessian(                            /* anisotropic radii & pos. gradient */
528                      add2gradient(gradient, gradrow[j], graddia, gradcol, backg);
529                  }
530                                          /* initialize edge in next row */
531 <                comp_fftri(&fftr, hp, i+1, j+1, VDB_x, vflags);
531 >                comp_fftri(&fftr, hp, AI(hp,i+1,j+1), AI(hp,i+1,j));
532                  if (hessrow != NULL)
533                      comp_hessian(hessrow[j], &fftr, hp->rp->ron);
534                  if (gradrow != NULL)
535                      comp_gradient(gradrow[j], &fftr, hp->rp->ron);
536                                          /* new column edge & paired triangle */
537 <                backg = back_ambval(hp, i+1, j+1, VDB_x, VDB_y, vflags);
538 <                comp_fftri(&fftr, hp, i, j+1, VDB_Y, vflags);
537 >                backg = back_ambval(hp, AI(hp,i+1,j+1),
538 >                                        AI(hp,i+1,j), AI(hp,i,j+1));
539 >                comp_fftri(&fftr, hp, AI(hp,i,j+1), AI(hp,i+1,j+1));
540                  if (hessrow != NULL) {
541                      comp_hessian(hesscol, &fftr, hp->rp->ron);
542                      rev_hessian(hessdia);
# Line 684 | Line 556 | ambHessian(                            /* anisotropic radii & pos. gradient */
556                                          /* release row buffers */
557          if (hessrow != NULL) free(hessrow);
558          if (gradrow != NULL) free(gradrow);
687        free(vflags);
559          
560          if (ra != NULL)                 /* extract eigenvectors & radii */
561                  eigenvectors(uv, ra, hessian);
# Line 720 | Line 591 | ambdirgrad(AMBHEMI *hp, FVECT uv[2], float dg[2])
591   }
592  
593  
594 < /* Make sure radii don't extend beyond what we see in our periphery */
595 < static void
596 < hem_radii(AMBHEMI *hp, FVECT uv[2], float ra[2])
594 > /* Compute potential light leak direction flags for cache value */
595 > static uint32
596 > ambcorral(AMBHEMI *hp, FVECT uv[2], const double r0, const double r1)
597   {
598 < #ifdef HEM_MULT
599 <        double          udsum = 0, vdsum = 0;
600 <        double          uwsum = 0, vwsum = 0;
598 >        const double    max_d = 1.0/(minarad*ambacc + 0.001);
599 >        const double    ang_res = 0.5*PI/(hp->ns-1);
600 >        const double    ang_step = ang_res/((int)(16/PI*ang_res) + (1+FTINY));
601 >        double          avg_d = 0;
602 >        uint32          flgs = 0;
603 >        FVECT           vec;
604 >        double          u, v;
605 >        double          ang, a1;
606          int             i, j;
607 <                                        /* circle around perimeter */
607 >                                        /* don't bother for a few samples */
608 >        if (hp->ns < 12)
609 >                return(0);
610 >                                        /* check distances overhead */
611 >        for (i = hp->ns*3/4; i-- > hp->ns>>2; )
612 >            for (j = hp->ns*3/4; j-- > hp->ns>>2; )
613 >                avg_d += ambsam(hp,i,j).d;
614 >        avg_d *= 4.0/(hp->ns*hp->ns);
615 >        if (avg_d*r0 >= 1.0)            /* ceiling too low for corral? */
616 >                return(0);
617 >        if (avg_d >= max_d)             /* insurance */
618 >                return(0);
619 >                                        /* else circle around perimeter */
620          for (i = 0; i < hp->ns; i++)
621              for (j = 0; j < hp->ns; j += !i|(i==hp->ns-1) ? 1 : hp->ns-1) {
622                  AMBSAMP *ap = &ambsam(hp,i,j);
623 <                FVECT   vec;
624 <                double  us2, vs2;
623 >                if ((ap->d <= FTINY) | (ap->d >= max_d))
624 >                        continue;       /* too far or too near */
625                  VSUB(vec, ap->p, hp->rp->rop);
626 <                us2 = DOT(vec, uv[0]) * ap->d;
627 <                us2 *= us2;
628 <                vs2 = DOT(vec, uv[1]) * ap->d;
629 <                vs2 *= vs2;
630 <                udsum += us2 * ap->d;
631 <                uwsum += us2;
632 <                vdsum += vs2 * ap->d;
745 <                vwsum += vs2;
626 >                u = DOT(vec, uv[0]) * ap->d;
627 >                v = DOT(vec, uv[1]) * ap->d;
628 >                if ((r0*r0*u*u + r1*r1*v*v) * ap->d*ap->d <= 1.0)
629 >                        continue;       /* occluder outside ellipse */
630 >                ang = atan2a(v, u);     /* else set direction flags */
631 >                for (a1 = ang-.5*ang_res; a1 <= ang+.5*ang_res; a1 += ang_step)
632 >                        flgs |= 1L<<(int)(16/PI*(a1 + 2.*PI*(a1 < 0)));
633              }
634 <        uwsum *= HEM_MULT;              /* adjust effective hem size */
635 <        vwsum *= HEM_MULT;
636 <                                        /* cap radii (recall d=1/rt) */
637 <        if (ra[0]*udsum > uwsum)
638 <                ra[0] = uwsum/udsum;
639 <        if (ra[1]*vdsum > vwsum)
640 <                ra[1] = vwsum/vdsum;
641 < #endif
634 >                                        /* add low-angle incident (< 20deg) */
635 >        if (fabs(hp->rp->rod) <= 0.342) {
636 >                u = -DOT(hp->rp->rdir, uv[0]);
637 >                v = -DOT(hp->rp->rdir, uv[1]);
638 >                if ((r0*r0*u*u + r1*r1*v*v) > hp->rp->rot*hp->rp->rot) {
639 >                        ang = atan2a(v, u);
640 >                        ang += 2.*PI*(ang < 0);
641 >                        ang *= 16/PI;
642 >                        if ((ang < .5) | (ang >= 31.5))
643 >                                flgs |= 0x80000001;
644 >                        else
645 >                                flgs |= 3L<<(int)(ang-.5);
646 >                }
647 >        }
648 >        return(flgs);
649   }
650  
651  
# Line 763 | Line 657 | doambient(                             /* compute ambient component */
657          FVECT   uv[2],                  /* returned (optional) */
658          float   ra[2],                  /* returned (optional) */
659          float   pg[2],                  /* returned (optional) */
660 <        float   dg[2]                   /* returned (optional) */
660 >        float   dg[2],                  /* returned (optional) */
661 >        uint32  *crlp                   /* returned (optional) */
662   )
663   {
664          AMBHEMI *hp = inithemi(rcol, r, wt);
# Line 783 | Line 678 | doambient(                             /* compute ambient component */
678                  pg[0] = pg[1] = 0.0;
679          if (dg != NULL)
680                  dg[0] = dg[1] = 0.0;
681 +        if (crlp != NULL)
682 +                *crlp = 0;
683                                          /* sample the hemisphere */
684          acol[0] = acol[1] = acol[2] = 0.0;
685          cnt = 0;
# Line 792 | Line 689 | doambient(                             /* compute ambient component */
689                                  addcolor(acol, ap->v);
690                                  ++cnt;
691                          }
692 <        if (!cnt) {
693 <                setcolor(rcol, 0.0, 0.0, 0.0);
797 <                free(hp);
798 <                return(0);              /* no valid samples */
799 <        }
800 <        if (cnt < hp->ns*hp->ns) {      /* incomplete sampling? */
692 >        if ((hp->ns < 4) | (cnt < hp->ns*hp->ns)) {
693 >                free(hp);               /* inadequate sampling */
694                  copycolor(rcol, acol);
695 <                free(hp);
803 <                return(-1);             /* return value w/o Hessian */
695 >                return(-cnt);           /* value-only result */
696          }
697          cnt = ambssamp*wt + 0.5;        /* perform super-sampling? */
698 <        if (cnt > 0)
698 >        if (cnt > 8)
699                  ambsupersamp(acol, hp, cnt);
700          copycolor(rcol, acol);          /* final indirect irradiance/PI */
701          if ((ra == NULL) & (pg == NULL) & (dg == NULL)) {
702                  free(hp);
703 <                return(-1);             /* no radius or gradient calc. */
703 >                return(-1);             /* no Hessian or gradients requested */
704          }
705          if ((d = bright(acol)) > FTINY) {       /* normalize Y values */
706                  d = 0.99*(hp->ns*hp->ns)/d;
# Line 817 | Line 709 | doambient(                             /* compute ambient component */
709                  K = 1.0;
710                  pg = NULL;
711                  dg = NULL;
712 +                crlp = NULL;
713          }
714          ap = hp->sa;                    /* relative Y channel from here on... */
715          for (i = hp->ns*hp->ns; i--; ap++)
# Line 836 | Line 729 | doambient(                             /* compute ambient component */
729                                  ra[0] = 1.0/d;
730                          if (ra[1]*(d = fabs(pg[1])) > 1.0)
731                                  ra[1] = 1.0/d;
732 +                        if (ra[0] > ra[1])
733 +                                ra[0] = ra[1];
734                  }
840                hem_radii(hp, uv, ra);
841                if (ra[0] > ra[1])
842                        ra[0] = ra[1];
735                  if (ra[0] < minarad) {
736                          ra[0] = minarad;
737                          if (ra[1] < minarad)
738                                  ra[1] = minarad;
739                  }
740 <                ra[0] *= d = 1.0/sqrt(sqrt(wt));
740 >                ra[0] *= d = 1.0/sqrt(wt);
741                  if ((ra[1] *= d) > 2.0*ra[0])
742                          ra[1] = 2.0*ra[0];
743                  if (ra[1] > maxarad) {
# Line 853 | Line 745 | doambient(                             /* compute ambient component */
745                          if (ra[0] > maxarad)
746                                  ra[0] = maxarad;
747                  }
748 +                                        /* flag encroached directions */
749 +                if ((wt >= 0.89*AVGREFL) & (crlp != NULL))
750 +                        *crlp = ambcorral(hp, uv, ra[0]*ambacc, ra[1]*ambacc);
751                  if (pg != NULL) {       /* cap gradient if necessary */
752                          d = pg[0]*pg[0]*ra[0]*ra[0] + pg[1]*pg[1]*ra[1]*ra[1];
753                          if (d > 1.0) {

Diff Legend

Removed lines
+ Added lines
< Changed lines
> Changed lines